浅谈提示词发展现状,Prompt 自动优化是未来。 特工宇宙 • 2024-05-18 09:06 • 产品 • 305 views #封面手绘于本科期间,当年在知乎上写的第一篇关于 AI 的文章就用的这个封面,聊表纪念。 继上一次浅谈当下国内 AI Agent 现状,钉钉和扣子走在前列之后,这次我们来聊聊 Prompt. 本来想取一个类似“提示词不存在了…”,或是“再见,Prompt 课程…”的标题,但最近很多大佬的谬赞让我感到诚惶诚恐,后来想想还是算了。 从 2022 年 11 月起,刚刚入门 NLP 的我开始研究大模型,期间也学习过一些论文,以及一些提示词书写框架。 以下是我这一年半以来,混迹大模型上中下游,沉淀出的一些思考。 我整理了一个流程图,概括了这一年多我看到的 Prompt 的一些发展。 图 1-1 Prompt 发展脉络图 在最早期,少数爱好者经过不断的尝试,根据经验,加之一些前沿论文的探究学习,总结了许多能让大模型输出更好效果的提示词技巧和框架,爱好者不断增加+教程不断完善,渐渐诞生了许多 KOL 以及提示词社区。 再后来,大概 2023 年 6 月左右,以文心一言和科大讯飞为代表,各家大模型产品开始内嵌了许多“助手”,即基于 Prompt 创建完成的 Bots.平台还加上了一些 UGC 的玩法,靠大赛/教学等激励方式,涌现了许多丰富的 Bot,本质上是将 Prompt 社区做到了自家产品里。 作为一个 toC 产品,给用户不断提供新颖的 Bot 的策略是对的,但当时一些厂商过于追求数量(可能是为了发布会装逼),体验过后会发现绝大部分 Bot 没有任何意义,提效类的经常出错,娱乐类的经常出戏。 随着模型能力的不断迭代以及 Agent 的不断迭代,后来 OpenAI 发布了 GPTs,各家也一个接一个地推出了“商店”或是“广场”,比如最近 Kimi 推出了 kimi+. 发展到现在,Bot 的创建也不只局限于 Prompt,还衍生了外挂知识库、调用 API,工作流创建等等玩法,而曾经的那个 Bot 或是助手,也被很多家换了个新名字——智能体。 与此同时,许多厂商也推出了,使用“@”或是“/”,即可在对话框中快捷唤起提示词模板,或是 Bot. 图 1-2 文心一言对话框(获取 Prompt) 图 1-3 Kimi 对话框(获取 Bot) 在一些平台上,用户也可以收藏 Prompt 作为常用语。 图 1-4 Kimi 对话框(设置常用语) 这是一个入口级的提升,用户无需查阅多次打开三方提示词网站,或是个人笔记,在大模型平台上就能一站式完成。但是这只解决了收藏和使用的问题,没有解决创作的问题。 于是业界逐渐往提示词自动优化方向发展,什么是提示词自动优化?即用户属于简单的自然语言后,AI 会自动优化这段 Prompt. 一种是用户看不到的,即大模型自身根据用户输入后,黑盒式做了一些分析,用户无感知。还有一种是用户能看到的,可以二次调整的,比如扣子和 Claude. 视频 1-1 Claude 演示视频 图 1-5 扣子 Bot 创建页面 实现提示词的自动优化,最简单粗暴的方式就是用 Prompt 来优化 Prompt,专家通过设计一套固定且适合自身大模型的提示词,用户上传的 Prompt 会被润色且结构化。 此外还有一些更复杂的提示词自动优化的方法,比如 APE(Automatic Prompt Enginnering)、OPRO(Optimization by Prompting)、AutoPrompt 等等。 图 1-6 Prompt 方法大全 而具体实现的一些算法原理,可以去查看上图中方法对应的论文,也可查看去年爆火的大模型综述,如今出书了(附下载)一书,里面讲述了自动提示优化的一些方法。 图 1-7 《大语言模型》一书第十章 我认为,长期来看,研究提示词的群体只限于相关学者,以及一小撮热爱者。 普通人深究提示词框架和书写技巧意义不大,且未来靠教学 Prompt 变现不是一门好生意。 原因有三: 第一,提示词技巧的可迁移性较差,相同的提示词在不同的模型上表现能力不同,甚至在同一模型的不同更新版本上表现能力也不同。比如现在很多主流的技巧,都是基于 GPT4 的,但很多方法迁移到国产大模型当中,得到的效果非常一般。如果模型能力不行,提示词写的天花乱坠又有什么用?以及,如果 GPT5 来了,模型足够智能,现在这些技巧还有多少用武之地? 第二,让所有用户都来学习如何写出高质量的提示词,并不现实。从用户体验的角度来看,各家大模型一定是往“即使是最简单的自然语言,也能让用户得到满意的回答”的方向发展。在模型的智能化程度还未达到下一个高点之前,像扣子等平台的提示词自动优化就是一个很好的当下最优解。 第三,模型朝着 AGI 发展,未来语音交互会成为主流。语音交互的场景更加丰富,效率也更高,用户总不可能念出来上百字的提示词内容吧?未来模型对话一定是开袋即食的。 基于以上观点,我认为提示词社区的发展空间也不大。 随着各家模型和平台不断迭代,入口已经被其垄断了,用户创建、学习、分享等行为,会在该平台实现闭环,没有再上三方网站的必要。拿去年名噪一时的 FlowGPT 举例,现在也已经全面 Character.ai 化了,充斥着各种 AI 虚拟陪伴的 Bots. 图 2-1 FlowGPT 官网截图 而最近,也没怎么听过身边的朋友谈论 PromptPort(另一个之前比较火的提示词社区)了。 还记得 JinaAI 很早就做了一个名为 PromptPerfect 的项目,即自动优化用户上传的提示词,我认为这个产品夹杂在用户和模型之间,生存空间也很受限。toC 目前用户的选择非常多样,又有多少人愿意付费优化自己的 Prompt?toB 的话,以目前大模型这个内卷程度,大模型公司自己估计就端到端完成了。 图 2-2 PromptPerfect 测试截图 在这一年半里,我见证了许多朋友,凭借对 Prompt 的研究,有拿到了融资的,有拿到了黑客松冠军的,也有知识变现近百万的,也有从一般程序员成长为 AI 圈 KOL 的,有成为高校讲师的,有成功出版第一本书的… 尽管有的 Prompt 的项目烂尾了,尽管有的教程内容也有些过时了,但这些勇于尝试的人,在这样一个时期,在这样一个风口上,终究是拿到了一些结果。 那么下一个风口是什么呢? 或许是 Agent 吧。 所以该干什么不用我多说了吧~放个名片自己体会~ 说到 Agent,最近有关“Workflow 是不是伪需求”的讨论也非常热烈,我们已经策划一期沙龙活动和一篇相关探讨文章,敬请期待。 此外,也有很多朋友在质疑“AI 是否真的能提供情绪价值/心理治疗”,于是我们邀请了来养一只治愈自己的 AI 小动物吧一文提到的盒子姐姐,在本周日(5 月 19 日)晚上八点,直播分享《当我们需要 AI 陪伴时,真正需要的是什么》,速速预约!~ AI 发展太快了!存在太多的非共识,有太多的问题值得思考,值得讨论。 让我们一起脑暴,一起经历,一起成长。 原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/05/2527.html Like (0) 0 Generate poster 微信扫码分享 关于作者 特工宇宙 大模型日报(5月17日 学术篇) Previous 2024-05-17 19:24 大模型日报(5月18~19日 资讯篇) Next 2024-05-19 19:14 相关推荐 产品 真格基金刘元:在这个时代,什么样的创业者更能脱颖而出?|Z Talk Z Talk 是真格分享认知的栏目。 近日,由 wteam 主办的 2024 中国 Z 世代青年创业者大会在广州圆满落下帷幕。大会吸引了 500 余位 Z 世代青年创业者,汇聚了近… 2024-09-24 2970 产品 MolarData| AI领域资讯速递 MOLAR NEWS 2021年第1期 MolarData人工智能每周见闻分享,每周一更新。 前沿丨MIT提出Liquid机器学习系统,可像液体一样适应动态变化 麻省理工学院(… 2021-02-23 1450 产品 真格天使项目「云天励飞」成功挂牌科创板 2015 年 7 月 12 日,我第一次在徐老师家里见到陈宁博士,交流了一小时,深深感受到团队的愿景和潜力,跟徐老师和 Anna 商量了一下就当场做了投资的决策。虽然当时的 AI … 2023-04-04 2220 产品 闪耀进博会的 N+1 种黑科技|Z News Z News 是真格的新闻栏目。 11 月 5 日- 10 日,第六届中国国际进口博览会举行。以「新时代,共享未来」为主题,数千家参展商相聚上海,创新产品、创新技术、创新服务集中亮… 2023-11-13 1400 产品 Let’s Vision!一起来 Apple 生态大会! 非常荣幸作为 Let’s Vision 的媒体合作方向大家介绍这次活动! 这是国内首个聚焦空间计算+AI 融合的顶级技术盛会。全球百大开发者天团将在此集结,Vision… 2025-02-26 660 产品 真格基金尹乐:见证禾赛的成长和蜕变,持续助力科技创新、重仓年轻创业者 2023 年 2 月 9 日,禾赛科技成功以“HSAI”为股票代码在纳斯达克挂牌上市,成为“中国激光雷达第一股”。禾赛开盘报 23.75 美元,较发行价大涨 25%,… 2023-02-10 1860 产品 「傲图科技」宣布完成数百万美元种子轮融资|Z News 更多被投新闻 依图科技 | Momenta | Nuro | 云天励飞 禾赛科技 | 晶泰科技&nb… 2023-08-15 2110 产品 对话吴翼:我们需要的,或许不是更聪明的 AI|此话当真 EP21 用声音,听见真格。 「此话当真」是一档泛商业类播客,我们希望搭建这样一个分享和交流的平台,让每一个对商业、科技、创投充满好奇的人都能在这里有所收获。每期播客将会由不同的真格投资人担… 2024-04-02 1870 产品 吹气球登上Nature封面;人工神经元与猕猴神经元有强对应;Google发布标注最详细的情绪数据集;在元宇宙里拥有触觉成为可能 MOLAR FRESH 2021年34期 人工智能新鲜趣闻 每周一更新 01 吹气球也能上Nature封面!普林斯顿大学开发“花式气球”软机器人 只要你敢想,吹气球还能登… 2021-11-22 1740 产品 大模型日报(3月3日 资讯篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2025-03-03 610