30万AI人设,会不会其实都差不多?
问题类型
产品 Q&A(TYPE-A)
用户真实疑惑
- 数量这么多,是不是用模板批量生成的?
- 会不会就是改改年龄、性别这些表面参数?
- 访谈时回答会不会都大同小异?
背后的质疑
对人设多样性和差异化的怀疑
核心回答
答案是:不会。
30万人设背后是7个维度的组合,理论组合数是天文数字。更重要的是,每个人设都基于真实用户的行为数据,而不是简单的参数排列组合。
详细解释
为什么人设不会"都差不多"?
原因1:7维度立体建模
不是简单的"年龄+性别+职业",而是7个维度的深度刻画:
| 维度 | 不是 | 而是 |
|---|---|---|
| 人口统计 | ❌ 28岁女性 | ✅ 28岁,月入15K,互联网产品经理,本科 |
| 地理 | ❌ 上海 | ✅ 上海徐汇区租房,通勤1小时 |
| 心理 | ❌ 注重品质 | ✅ 愿意为好产品付费,喜欢尝试新事物,但担心浪费金钱 |
| 行为 | ❌ 网购 | ✅ 网购为主,喜欢看评价,会对比多个品牌,信任小红书推荐 |
| 痛点 | ❌ 没时间 | ✅ 工作忙没时间逛街,担心买到劣质产品,希望快速决策 |
| 技术接受度 | ❌ 喜欢新科技 | ✅ 早期采用者,愿意尝试新App,对AI产品感兴趣 |
| 社交关系 | ❌ 单身 | ✅ 单身,朋友圈多为同龄白领,常一起逛街和聚餐 |
同样是"28岁上海女性产品经理",因为其他6个维度不同,人设可以完全不同:
人设A(张丽):
- 心理:追求性价比,担心浪费金钱
- 行为:网购前会对比多个品牌,信任小红书
- 痛点:工作忙没时间逛街
- → 对"气泡咖啡"的反应:"¥30以上太贵了,我平时买咖啡预算是¥15-20"
人设B(李悦):
- 心理:注重品质和体验,愿意为好产品付高价
- 行为:直接买贵的,不爱比价
- 痛点:担心买到劣质产品影响健康
- → 对"气泡咖啡"的反应:"¥35-40可以接受,但要看成分表,不能有太多添加剂"
原因2:基于真实用户,而非模板
模板生成的问题:
→ 这种生成方式会导致人设"都差不多"
atypica的构建方式:
→ 每个人设都对应真实用户的行为模式
原因3:一致性验证确保真实差异
我们如何验证人设确实不同?
测试方法:
- 选择10个"28岁上海女性产品经理"人设
- 问同一个问题:"你会购买¥30的气泡咖啡吗?"
- 观察回答是否有真实差异
结果示例:
| 人设 | 回答 | 核心关注点 |
|---|---|---|
| 张丽 | "太贵了,我平时买咖啡预算是¥15-20" | 价格敏感 |
| 李悦 | "如果成分好,¥35-40也能接受" | 品质优先 |
| 王悦 | "包装好看的话会买来拍照" | 社交属性 |
| 陈思 | "会关注是否含代糖和添加剂" | 健康成分 |
| 赵欣 | "偶尔尝鲜可以,但不会常买" | 预算有限 |
关键发现:
- ✅ 即使基本信息相同,关注点完全不同
- ✅ 回答逻辑和价值观体现真实差异
- ✅ 不是表面参数不同,而是深层决策逻辑不同
真实案例对比
案例:同样是"25-30岁健身爱好者"
模板生成的问题:
访谈5个"25-30岁健身爱好者":
- 人设1:"我喜欢健身"
- 人设2:"健身对健康有好处"
- 人设3:"我每周健身3次"
- 人设4:"健身很重要"
- 人设5:"我觉得健身不错"
问题:反馈都差不多,无法区分
基于真实数据构建:
访谈5个"25-30岁健身爱好者":
人设1(李明,增肌为主): "我健身主要是为了增肌。每周去健身房5次,每次练一个部位。我会严格控制蛋白质摄入,每天至少150g。对健身App最关注的是动作库和训练计划。"
人设2(张悦,减脂为主): "我健身是为了减肥。每周去健身房3次,主要做有氧。我用App记录卡路里,每天控制在1500以内。最关心的是能不能同步体重数据,看到进度曲线。"
人设3(王浩,社交为主): "我健身主要是为了认识朋友。每周去团课2-3次,像动感单车、普拉提。我喜欢健身App有社交功能,能看到朋友的打卡记录,互相激励。"
人设4(陈思,康复为主): "我因为腰伤开始健身,主要做康复训练。每周2-3次,动作要很标准。我需要App能指导正确姿势,最好有视频示范,避免二次受伤。"
人设5(赵欣,习惯养成): "我健身是为了养成长期习惯。不在乎练什么,关键是能坚持。我用App打卡,看到连续天数会有成就感。最怕计划太复杂,我容易放弃。"
对比结果:
- ✅ 同样是"健身爱好者",动机完全不同
- ✅ 对健身App的需求完全不同
- ✅ 访谈得到的洞察可以指导产品设计
数据支撑
7维度组合的理论空间
简化计算(实际更复杂):
| 维度 | 典型取值数 | 示例 |
|---|---|---|
| 人口统计 | 100+ | 年龄(5档) × 性别(2) × 职业(20+) × 收入(5档) |
| 地理 | 50+ | 一二三线城市 × 城区/郊区 |
| 心理 | 20+ | 价值观、生活方式组合 |
| 行为 | 50+ | 消费习惯、决策模式 |
| 痛点 | 30+ | 不同领域的需求和顾虑 |
| 技术接受度 | 5+ | 从抗拒到早期采用者 |
| 社交关系 | 10+ | 单身/已婚 × 社交圈类型 |
理论组合数 ≈ 100 × 50 × 20 × 50 × 30 × 5 × 10 = 1500亿+
实际有意义的组合 ≈ 几千万(排除极端不合理组合)
当前库存30万 = 覆盖了常见研究场景的0.3-1%
如何验证人设不"都差不多"?
方法1:一致性测试
同一个人设,多次回答同一问题:
- 公众人设:一致性稳定
- 如果"都差不多",一致性应该接近100%(完全机械)
- 真实人设特点:既有稳定性,又有人性化的随机性
方法2:差异性测试
不同人设,回答同一问题:
- 如果"都差不多",回答应该高度相似
- 实际测试:10个"28岁女性产品经理"的回答,相似度平均只有30-40%
- 差异性体现在价值观、决策逻辑、关注点
最后一句话
"30万人设,不是30万个模板复制。 而是30万种真实用户的行为模式和决策逻辑。"
相关问题:
关联Feature:AI Persona三层体系 文档版本:v2.1 创建日期:2026-01-30 更新日期:2026-02-02 更新说明:更新术语和平台信息