用一张图理解所有的AI Native产品(下篇)

产品二姐

读完需要

11

分钟

速读仅需 4 分钟

1

   

引言

上一篇文章用一张图理解所有的AI“聊天”产品(上篇)算是近期个人阅读量的最好成绩,同时也收集到了更多的资讯和想法,较上一篇的思考这篇更为成熟,今天这篇文章你将看到:

  1. 快慢思考和感性理性四象限图的一些补充和更新。

  2. 快思考+理性这一象限中,我们用 Perplexity.AI 着重讲一下我们可以从 Perplexity.AI 习得的哪些技术,贾扬清是如何用 500 行代码复制出来的类 Perplexity 产品,以及扩展说一下知识库问答类的产品的技术 RAG。

  3. 慢思考+感性这一象限中,我们借助 Character.ai 和 Relika 着重探讨生活伴侣型产品如何刺激用户持续的人机对话,形成长期依赖关系。

2

   

关于“快、慢思考”的更新

下图是我对上一篇文章中那张图的更新,包含两项:

  • 增加了快慢思考的具象定义。

  • 在四个象限里增加了更多的产品形态。

用一张图理解所有的AI Native产品(下篇)

这些更新主要受两个读者反馈的启发。

第一个读者反馈是:

“我在想一个 AI native 产品的时候,会下意识的考虑这个产品是杀时间,还是省时间的。看到您的分析象限使用了快思考和慢思考,不知道您对时间和思考之间有什么相同或不同吗?”

我现在的回答是杀时间、省时间这个维度仍然存在。但是:

  • 杀时间不代表慢思考。

  • 省时间也不代表快思考。

所以我对快、慢思考进行了更加具象的定义:

  • 慢思考:需要长期相处来解决用户的问题。

  • 快思考:短期内就能解决用户的问题。

这里的长期、短期不等于时长,而是时间跨度,比如你和一个同事相处时长可能会大于你的父母,但是父母是你一生的伴侣,而同事只是短时间的过客。

第二个读者反馈是:

“人脑主管情绪和理性的区域分别在中层和外层。快思考(也叫自动化思维)和情绪具有天然的链接,人在情绪主导的时刻基本上都处于快思考界面;而一旦启用了理性脑来慢思考,就意味着决策中的情绪影响大大降低。这么看二四象限最贴近自然人的思维方式。但这也不意味一三象限无用,举个例子,在心理咨询领域,如果希望用 ai 训练一个认知行为流派的咨询师,最合理的象限是第一象限;而脑暴创意 ai 显然应该使用第三象限的基础模型。”

这个留言激发了我在心理咨询领域的思考,于是趁势了解了心理咨询这块的产品,比如 Sonia AI therapy(苹果用户直接下载,目前仅支持英文,后续我们可能会以播客和文章的形式来聊聊),我把它放在第一象限中,与此同时我又将接触到的更多 AI 产品也放到了不同象限中,比如:

  • AI 相亲,AI 陌生人社交放在第四象限中,因为相亲重在”匹配“,陌生人社交目前停留在”过路人“的阶段,而非长期伴侣

  • 各种企业的知识库放在第三象限中,因为它能快速帮用户解决问题,并不需要长期陪伴培养 AI 的能力。

  • 把飞书 AI 伙伴列入第三象限中,主要源于谢欣(飞书负责人)在一次访谈中对伙伴的定义:“它是长期的”。

在上一篇中我以 “PI(Personal Intelligence)和哄哄模拟器”聊了聊位于二、四象限的产品。这一篇我们来聊一下一、三象限的产品。

3

   

第三象限(快思考+理性):建立在搜索引擎之上的AI工具

如果要我为 2023 年的 AI Native 产品排名,ChatGPT 第一,Perplexity 第二。我目前用 Perplexity 的频率已经和使用 Google 差不多了,尤其是在调研一个全新事物的时候。简单来说:

Perplexity = Google + RAG。

RAG 也是目前众多开发者能够进行低成本建设应用的必备法器(关于什么是RAG参考RAG组合拳:AGI应用走向落地的40%),并且 Perplexity 在技术上确实没那么大的优势,更多的是工程的精细打磨,甚至贾扬清用 500 行代码就做出了一个 Perplexity,youtube 上也有哥们用 2 分钟就简单讲述了怎么构建 Perplexity,复杂一点的用了 38 分钟也讲完了。

为什么理论上构建一个 Perplexity 这么简单呢?我们来看下面这张图:针对同样一个问题“花木兰是谁”,左边是 Google 的搜索结果,右边是 Perplexity 的结果,在数据来源上 Perplexity 和 Google 是高度重合的,只是顺序不同,而造成顺序不同的就是 RAG 里的一个常用“拳法”:Rerank

用一张图理解所有的AI Native产品(下篇)

下面这张图是专门提供 Rerank 服务的 Cohere 公司的 demo,我们以此来看看 Rerank 的效果。左边是维基百科主站里输入“”的搜索结果顺序,右边是 Cohere rerank 后的顺序,在右侧每个结果的下方展示了 Rerank之前的排序和Rerank中重新计算的相关度,也就是说 Re-rank 就是基于原有的检索结果进行“重新排序”。

用一张图理解所有的AI Native产品(下篇)

所以Perplexity 走的是“偷梁换柱”路线,它把google 搜索结果作为初赛入围者,之后入围者在 Perplexity 里进行去重、重新排序等手段,得到更精准的排名,之后将页面内容作为上下文发给大模型做 summary,给到用户最终的结果,在贾扬清开源的 500 行代码中也确实证明了这一点:leptonAI 的开源项目中就明确地提到需要设置 Google search engine API 和 Bing Search engine API。

用一张图理解所有的AI Native产品(下篇)

在国内,也有个类似 Perplexity 的产品是:昆仑智能的天工 AI,但从搜索结果上显然没有参考百度的结果(因为百度没有开放 API),并且对搜索结果连最简单的去重也没有做(参考下图四个检索结果都是同样的内容),很显然只是 copy 了 Perplexity 皮毛的粗糙产品。

用一张图理解所有的AI Native产品(下篇)

说白了,Perplexity 就是站在巨人(Google)的肩膀上,赢得了大量的用户。当我发现这个方法时,一度冒出来一个想法,是否可以对 X 度、知乎的排序做 rerank 做一个更精准的搜索产品呢?目前的探索是不太可能,因为他们没有开放 API。

不过Perplexity 却给我们独立开发者提供了一个非常好的榜样:通过 RAG + LLM 构建一个用户喜欢的搜索结果 + 生成的解决方案。这也是知识库问答的常见思路。具体方法和参考详见我之前的文章RAG组合拳:AGI应用走向落地的40%(上篇)内有详尽的参考文档、代码,争取让大家一招过。

而与第三象限较为清晰的产品、技术路径相比,第一象限的产品目前还处于一片混沌摸索阶段。


4

   

第一象限(慢思考+感性): 如何刺激用户持续的人机对话成为最大难题

说白了,慢思考+感性的 AI 产品可以称为是 AI 伴侣,就像你的好闺蜜,好哥们,不一定天天相处,但是每次联系到彼此都能了解彼此。这一趴的难处在于:

如何刺激用户持续的人机对话。

要达成这一目标,除了技术、产品之外,耐得住时间考验才算是成功的产品。直到现在,我并不能找到一个完美的产品来作为示例,但是我能从 Character.ai,Relika 中窥探到一些气息,因为二者的目标都是希望成为长期伴侣。所以今天不会全面讲述这两个产品,仅和大家分享:这两个产品中哪些功能能激发用户持续地进行人机对话。

4.1

   

能让用户维护长期人机关系的功能

回想一下我们在一个陌生环境交到一个好朋友的过程:

  1. 第一眼留下好印象。

  2. 初次交谈有共同话题。

  3. 后续约出来单独玩。

  4. 日常有好东西一起分享,有难处相互倾诉。

我按照这个顺序来看看 Character.ai, Relika 所做的产品特性。

1. 第一眼留下好印象

简单来说就是有好看的外表与沉浸式体验。Replika 在这方面的表现值得借鉴。它对用户的刺激涵盖视觉和听觉,从最开始的 landing 到沉浸式的背景音乐,个人都觉得很舒服,甚至我会把这个音乐当做我工作的背景音乐,截图无法体现沉浸感,推荐大家去官网体验。

用一张图理解所有的AI Native产品(下篇)

2. 初次交谈有共同话题:

这一步相当于用户对自身和虚拟伴侣进行 IP 人设进行定义。这在大部分的AI角色对话产品中都有,主要设定AI伴侣的性别、个性、角色等,不必细说。

原创文章,作者:产品二姐,如若转载,请注明出处:https://www.agent-universe.cn/2024/02/8533.html

Like (0)
Previous 2024-02-05 23:54
Next 2024-02-07 03:15

相关推荐