用一张图理解所有的AI“聊天”产品(上篇)

产品二姐

读完需要

12

分钟

速读仅需 4 分钟

1

   

引言

这一轮 AI 浪潮下,我一直没搞懂为啥一个聊天页面,能出来那么多产品。你看看,从外表看,他们几乎都有点雷同:一问一答几乎占据了页面的全部。

用一张图理解所有的AI“聊天”产品(上篇)

直到昨天,我在笔记本上画下了这张图,好像开始有了点脉络。

用一张图理解所有的AI“聊天”产品(上篇)

以下内容几乎全部围绕这张图片展开,我认为它能帮你:

  1. 为梳理众多 AI Native 产品提供一个分析框架。

  2. 如果你自己正在摸索 AI 创业,也会给你一个很好的参照系,帮助你如何选择基座模型,如何寻找数据,如何在应用层做好 Prompt,RAG 以及用户体验。


2

   

坐标系:AI 产品的新维度—“思考”的快与慢

这张图的横坐标很明确, 你可以定义为:理性→ 感性或者是工具类→情感类,这个维度是定义用户是在工作还是生活中使用,和互联网产品类似, 不必多讲。

纵坐标定义来源于《思考,快与慢》一书,借鉴知乎李博杰(正在 AI 创业的华为天才少年之一)的分享而来,“思考”这个维度就有点 AI native 的意思了,因为只有 AI 产品才会有这个维度。我们对快、慢思考的定义是:

  • 快思考是无意识、快速的思考,是自动反应、直觉思维。

  • 慢思考是将注意力转移到需费脑力的大脑活动上来,与行为、选择和专注等主观体验相关联。

举个例子:

  • 快思考是:这顿饭我吃啥。

  • 慢思考是:1 年内我的体脂率要降到百分之多少,决定我每天应该如何用餐。

快思考和慢思考没有优劣之分,需要同时存在,但是有时候同样的问题,用快、慢思考的方式也会得出不一样的答案。

而在 AI 产品里,思考的快与慢对应的就是 Token 的长与短,更粗糙一点说,是 Prompt 的长与短。

举个例子,prompt 工程里让大模型做推理有一个常用的技巧叫 COT(思维链),简单说,就是在提示词中加上一句话:“让我们一步一步来”,或者用一个例子说明一步步的推理过程,大模型推理结果的正确率会大大提升!(下图来自相关研究的论文:https://arxiv.org/abs/2205.11916)

用一张图理解所有的AI“聊天”产品(上篇)

其实这样的提示词就是在告诉大模型:请你使用慢思考的方式来解题。从这个角度想,人工智能和人脑表现是一致的!

现在我们对这个坐标系理解了,我们再来看看坐标系里的每一个产品。


3

   

理想中的 AI 产品:Samanthan

第一个产品是Samantha,你可能没听过,是的,ta 还不是一个产品,而是电影《her》里的对话机器人。《her》里的女主角是一个完全语音对话,没有物理真身的机器人。而这也是我所接触的影视作品中,最可能用大模型语言技术实现的机器人。剧中的男主人公是一个专门为别人写信的中年作家, 陷入婚姻危机后他在自己电脑上安装了一个 AI 操作系统 Samantha, 从最初的不以为然,后来和 Samantha 陷入爱河,再到 Samantha 的背叛(机器人同时在服务其他人),最后彻底失去 Samantha(操作系统被拆除),我真真切切感受到了一个艺术家对一个机器人伴侣的完美定义,甚至这里的导演就是最好的 AI 产品经理,他们明白用户的诉求:人可以从纯粹的对话和思考交流中进行社交,这和动物不一样的。

如果把 Samnthan 作为一个 AI 产品,我认为它在四个象限都达到了极高的位置,ta 可以是:

  • 你的情感伴侣 — 第一象限

  • 你的工作学习伴侣 — 第二象限

  • 你的工作助理 — 第三象限

  • 你的情感倾诉、发泄对象,生活小助理 — 第四象限

用一张图理解所有的AI“聊天”产品(上篇)

甚至我想 Samnthan 可能是这一轮 AI 浪潮的终极目标,达到 Samnthan 后,我们就不能再用思考的快与慢这个维度来衡量产品。 回顾互联网时代的产品,我们也经常拿一个四象限(以感性和理性为横坐标,以杀时间和省时间为纵坐标)来分析,你会发现互联网产品已经从最初的各自为阵,已经发展到现在的各产品相互抢占阵地。比如微信已经发展为一个融合了理性(企微、微信公众号)、感性(个微)、杀时间(视频号)和省时间(快速沟通)的工具了。达到 Samnthan 后,人类的 AI 产品将走向另外一个“超维” 空间,对 Samnthan 形成降维打击,就像 AGI 出现后对互联网产品会形成降维打击一样。

但在这个降维打击来临之前,会出现不同的聊天产品,尽管它们的主要交互都是 — “聊天”。我试图分析以下一些产品,并把他们放在相应位置,这会让我对这些产品的认知就会变得清晰起来。


4

   

不同象限中的AI产品


4.1

   

PI:第二象限的代表性产品

用一张图理解所有的AI“聊天”产品(上篇)

1)What is PI(Personal Intelligence)

以下是我通过和PI对话得到的 PI(Personal Intelligence)的自我介绍:

“PI是一个由最先进的语言模型技术驱动的个人 AI 助手。Inflection AI 是一家精通人工智能技术的公司,在 2022 年夏天(实际上是2023年5月)创建 PI,其目标是让个人 AI 助手能够被更多人使用。PI 有能力以自然和轻松的方式理解并回应你的问题和请求。”

创始人 Suleyman 在一次访谈中对 PI 的期望是:

It’s this new class of thing that is coach, confidant and advisor, a digital personal assistant, all in one.” (这是一种集教练、知己和顾问、数字个人助理于一体的新型事物。)

也正因如此,我把它放在了第二象限:工作学习伴侣。

2)模型层:PI 的基座模型

在模型层,PI 采用的是 Inflection 公司的自有大模型 Inflection AI。PI 和 ChatGPT 类似,是 Inflection 大模型的一个 demo 应用,而 Inflection 模型也会开放接口支持创建其他应用。

相比于使用大量的陈述性知识文本训练出来的 ChatGPT,Inflection-1 是使用大量模拟人们对话的对话集训练出来的,所以 Inflection 更擅长对话。当然,去年 11 月发布的 Inflection AI-2 在各个维度和 GPT-4 比还是有很大距离。

用一张图理解所有的AI“聊天”产品(上篇)

不过从创始人构成来看,Inflection 模型未来可期,他们在初期就融资 2.25 亿美元,也是非常厉害了。

  • Mustafa Suleyman: DeepMind(就是开发出 AlphaGo 的那家公司,2014 被 google 购买)联合创始人。

  • Karen Simonyan: 前 DeepMind 的首席科学家。

  • Reid Hoffman: 是 LinkedIn 的联合创始人和 Greylock 的合伙人。

用一张图理解所有的AI“聊天”产品(上篇)

3)应用层:PI 的用户体验:

整体感受,PI 的对话确实更加像对话,会产生很多的情绪(以感叹句、表情符号为表现)。

当然,如果要成为伴侣,意味着需要长期记忆,就像在《her》里的 Samantha,在若干天后还能记得男主人公的夙愿:向某知名出版社投稿得以采纳,出版了自己的书籍。

这一点我没有时间体会,可能需要长时间的积累,这一点没有深切的体会,但在 Inflection 的官网上非常显著的位置告诉用户:the more you personalize me, the more personally intelligent I can be。意译过来就是“你使用的越多,我就越适合你”(直译过来很别扭,我就自作主张意译一下)。

后续会持续使用一段时间看看效果。在 Pi 之外,我们再来说说最近爆火的“哄哄模拟器”。


4.2<

原创文章,作者:产品二姐,如若转载,请注明出处:https://www.agent-universe.cn/2024/01/8535.html

Like (0)
Previous 2024-01-26 14:12
Next 2024-01-27 20:03

相关推荐