atypica.AI

用「语言模型」为「主观世界」建模

"人们不是在处理概率,而是在处理故事。" — 丹尼尔·卡尼曼

People don't choose between things, they choose between descriptions of things. — Daniel Kahneman

商业研究的本质

商业研究是一门理解人类决策的学问。人并不只是根据纯粹理性做决策,而是受到叙事、情感和认知偏见的影响。所以,理解影响决策的机制是商业研究的核心。

如果,「物理」为「客观世界」建模;那么,「语言模型」则有机会为「主观世界」建模。Atypica.AI能够捕捉到通过数据分析处理的不够好的人类决策机制,为个人和商业决策问题提供深度洞察。

  • 通过构建「用户智能体」来「模拟」消费者的个性和认知
  • 通过「专家智能体」与「用户智能体」的「访谈」来分析消费者的行为和决策
  • 自动生成详尽的研究报告,提供可视化洞察
atypica@research:~

./atypica.ai --model "主观世界"

初始化主观世界模型...
加载用户智能体库...
加载专家智能体...
设置多智能体交互环境...
准备长推理模型...

[准备就绪] atypica.AI 已启动
              

run-research "为生日晚餐选合适的中餐餐馆"

启动研究流程:
- 正在明确研究问题...
- 设计工作任务序列...
- 浏览社交媒体数据源...
- 构建用户智能体模型...
- 启动智能体访谈...
- 分析用户反馈...
- 生成研究报告...

[进行中] 研究进度: 34%
              

研究流程

使用Atypica.AI,你只需要提出一个具体商业研究问题,系统会通过10-20分钟的「长推理」给出一份详尽的调研报告。

1

明确问题

2

设计任务

3

浏览社媒

4

建立智能体

5

访谈模拟

6

总结结果

7

生成报告

「Nerd Stats」会记录工作过程中耗费多少时间、步骤、有多少个智能体角色、耗费多少token等,这也是一种智能体的「工作证明」(Proof of Work)。

使用场景

T

测试 / Testing

评估营销内容选题与效果,预测受众反应

示例:罗技鼠标在小红书上选题,哪个会更受欢迎?

  • 【轻薄如羽,性能如虎】罗技MX Keys迷你版陪我高效办公的日常
  • 从按键到芯片:揭秘罗技键盘的静音科技是如何实现的
  • 一键多设备切换:我用罗技FLOW技术让工作效率翻倍的小技巧
  • 30天续航不是梦:罗技键盘背后的节能技术大揭秘
  • 人体工学设计背后的故事:罗技ERGO K860如何拯救我的腕隧道综合症
I

洞察 / Insight

发现用户体验痛点,了解客户评价和体验

示例:我是LV上海区总经理,客户对我们上海门店的购物体验有什么反馈?哪些方面需要改进,哪些方面做得好需要继续加强?请给我一个全面的报告。

C

共创 / Co-create

与模拟用户共同创意,开发新产品和服务

示例:和一线城市的年轻父母,一起共创Mars的<脆香米>的新产品想法?

P

规划 / Planning

制定市场营销策略,开发产品路线图

示例:INAH 银那无醇葡萄饮市场营销策划书

个人决策辅助

虽然Atypica.AI是以商业研究分析的智能体,但是也可以进行一些个人决策研究:

开放问题

为生日晚餐选合适的中餐餐馆?

选择问题

便携式显示器该怎么选?

规划问题

游泳特长生,该怎么规划去美国或英国读高中?

技术起源与发展

Atypica.AI的缘起

2023

多智能体互动

斯坦福小镇的论文《Generative Agents: Interactive Simulacra of Human Behavior》让我们第一次见识了多智能体互动的概念,但是这篇文章并没有真正的展示智能体如何进行交互的。

2023.12

模型工具调用

OpenAI发布了GPT-4的Function Calling功能,让模型能够调用外部工具;2024年11月,Claude的MCP协议,让我们看到了模型操作工具(比如我们做的内容管理工具)的可能性。这种技术进步开创了全新的应用场景,使模型不再局限于对话框内的交互,而是能够主动与外部世界建立连接。

2024.11

语言模型为主观世界建模

斯坦福小镇研究团队发表了题为《Generative Agent Simulations of 1,000 People》的开创性论文,该研究成功模拟了1000个随机美国人的行为模式。研究人员通过AI对真实人类进行深入采访,构建了能够准确反映个体行为和决策模式的智能体。令人瞩目的是,这些智能体与真人的行为一致性高达85%以上,展现出前所未有的模拟精度。

这项研究揭示了智能体模拟真实人类行为和进行有效访谈的巨大潜力。传统研究用户(如同研究橙汁)的方法是分析其组成元素(标签),但即使掌握了全部标签,也难以完整重构用户的复杂性。而这种新方法则相当于将橙汁提炼为精华粉末,再通过语言模型作为"水"将其重新冲调成橙汁。

2025.02

发散优先的长推理

Deepseek R1让我们看到透明的推理过程,因此知道了怎么来设计在基座模型基础上的推理架构。与针对客观世界/科学问题的推理方法强调"收敛"不同,主观世界/商业问题的推理需要强调"发散"。我们定义为四个维度:1)学习过去的案例、2)灵光乍现、3)反馈的质量、4)迭代的数量。

因此我们基于这四个维度,开始进行多步骤、长发散的推理模型架构"Creative Reasoning"的开发,从而形成对通用商业问题思考、分析、研究的调优。

2025.03

多智能体产品形态

Manus、Claude的Artifacts、Devin的发布,让我们看到了多智能体产品设计的可能性。尤其是Manus在如何把智能体工作过程表达出来,并可以进行回放上的产品创新。看到智能体如何工作,确实可以让人对其产生的结果更有同理心。

技术局限与展望

Atypica.AI的局限性

  • 1
    输入问题的质量

    输入问题的准确度,很大程度上决定了报告的质量

  • 2
    模型精确度局限

    斯坦福的研究中表明这种方法可以80%准确模拟消费者的复杂决策过程,对高度情感化或情境依赖的决策预测有局限,对新兴小众消费群体的模拟不够准确(合成橙汁还是和天然橙汁不一样)

  • 3
    数据整合复杂性

    数据质量和结构差异大,整合难度高,数据干净度问题可能导致模型扭曲;这种方法更善于模拟用户的正向和负向反馈,但是不擅长模拟用户的偏见和局限

  • 4
    创新性预测困难

    难以预测真正突破性的创新反应

方法类比

这种方法相当于将橙汁提炼为精华粉末,再通过语言模型作为"水"将其重新冲调成橙汁。

虽然这种「合成橙汁」并非完全天然,但它尽量模拟了真实橙汁的口感、色彩和营养特性。

展望未来

随着语言模型的持续发展和多模态能力的增强,Atypica.AI将在以下方面持续改进:

  • 更精准的用户画像和行为模型
  • 更深入的心理模型整合
  • 更细致的群体差异建模
  • 更透明的AI推理和解释系统
HippyGhost

HippyGhosts

atypica.AI的皮肤来自于代表极客精神的快乐嬉皮鬼社区HippyGhosts.io。

在Atypica.AI的世界中,每一个「智能体」的物理化身都是一枚「Hippy Ghost」,代表着技术与创意的融合,也象征着我们对构建有个性、有温度的AI智能体的追求。