过去的一个周末参加了百度和极客公园联合举办的AGI 黑客马拉松,也是人生第一次个人组队参加黑客松,虽然没有获奖,但收获很大,比如很多朋友,很多idea,扩展了我原来不知道领域,还得到了平时只能在媒体上见到的评委的点评(比如傅盛,杨洋)。如果有兴趣未来参与更多比赛的,可以私信我,咱们直接做搭档,或者帮你找搭档都可以。
今天和大家聊聊AGI黑客马拉松中那些获奖的idea, 我觉得有趣的idea,最后也和大家汇报一下我自己的idea。
1. 看看哪些idea能刺激到你
对于还在AI方面探索方向的朋友来说,黑客松就像一个脑暴大会。我先把这次Hackthon所有项目都列出来,看看是不是有哪个点子能刺激到你。
下图中红色圈选题目是Hackthon最终的一、二、三等奖,绿色的是现场选出来的人气奖。如果这其中有你感兴趣的主题,也可以私信我,我试着帮你搭桥找到对应的创作者。
在获奖的6个idea中,SuperCopyman 的prompt engineer 与 Awsome module with Awsome doc都是针对开发者的工具,不展开说了。
另外四个idea中,
1) Legal Tech innovators(法律) ,垂直于法律解决方案。得益于创作者对法律的深刻理解。
2)喵喵汪汪(AI教学助手)深入垂直教学。得益于十几年的教学经验。
3) AI惠生活: 是AI时代的团购,点评网。得益于创作者在大学时期做的拉群找优惠经验(貌似是有2w+的社群)。
4) 智链商圈:是实时的舆情仿真模拟,举个例子,最近的董宇辉事件,其实在很早的直播中就有苗头了,而小孙的事后道歉文案中其实也体现了诸多的不专业性更加惹恼了舆论。他们做的就是对文案的发布进行模拟仿真,预测舆论反馈,提高企业公关能力。
这四个应用中,有三个都得益于创作者过去经验的积累,其实这也是AI落地的一个重要模式: 领域+AI ,在这个模式内,可以说垂直领域的积累是诞生真正有用AI的必要条件,这也是我个人对目前AI应用实践中最大的体会。所以,如果你是某个领域专家,可以一起聊聊看看技术是否能对你有所帮助。
接下来再聊聊几个我觉得有意思的idea。
2. 我觉得有意思的idea
2.1 LLM as function
开发者Gus使用递归函数把提示词Prompt工程进行函数化,从而提高大模型开发的效率。举个例子,在提示词工程中,思维链提示(Chain-of-Thought,CoT)是一种常用的提高大语言模型推理能力的提示词技巧,意思是你在设定提示词时,需要将你的解题思路告诉大模型,而不仅仅是提问。举个例子,你想知道从北京到上海怎么去,如果你直接问GPT:
从北京到上海怎么去
这是没有CoT方式的提问,如果你采用以下方式提问,则是CoT方式提问。
从北京到上海怎么去?让我们一步步思考这个问题。
首先,你要查到北京到上海的距离,如果很近,可能步行就达到,如果很远就要采用其他交通方式
其次,你需要查询北京到上海之间有哪些交通工具
然后,你需要查询这些交通工具在什么时间段是可行的
最后,你再告诉我什么情况下,应该怎么从北京到上海。
甚至上述的问题中可能还嵌套着其他问题。可以看出,CoT的方式会让提示词变得复杂,那么这位创作者就用递归函数的方式让大模型再去生成提示词,下图来自创作者的路演截图(已征得作者同意转载)。
这样就可以大大减轻提示词的压力,我们仅需要输入“从北京到上海怎么去”,然后程序能自动通过调用大语言模型产生带有CoT思维的提示词。
不过在评委提问环节,也提到说这样的方法其实大模型公司本身就可以做,我想这也是最后他没有得奖的原因,而我个人之所以喜欢idea的原因是其中用到的函数思维。
开发者分享了他的Github: https://github.com/gusye1234/llm-as-function。感兴趣的朋友可以关注。
2.2 让每一句文字的心情都跃然纸上
这个idea是当你在写文字或者记录心情时,能通过“颜色”来反映文字中的情感记录。
比如:写下“今天来来参加黑客马拉松比赛啦”时,编辑框显示兴奋的红色。
如果你接着写下:“… 但是我们没有得奖” ,编辑框显示忧郁的蓝色。
最后你的心情日记就会是有颜色的记录,用一个词概括是”情绪可视化“。就像在皮克斯的电影《头脑特工队》(inside out)里,导演把一个小女孩内心的不同情绪用不同的精灵展示,将情绪拟人化表达出来。
再往深扩展一下:当你把心情颜色全部记录下来之后,就能体现你过去x天内心情的变化,可以结合心理学,统计学,再给出心理健康指导等等。
喜欢这个点的原因是:让文字的情绪变得可视化确实有点好玩,想象一下你在记录日记的时候,仿佛这个机器可以给你一些表情,就像机器和你产生了共情,就像你在照镜子一样。
同时这样情绪反馈功能也可以用在工作场景,比如我很生气的时候写的工作文档很可能是生硬的的,这样的提示也可以提醒我避免在工作中情绪化。这样一个小小的交互可以用在很多地方。
2.3 开启社交新方式,找到最懂你的人
这个idea是希望用AI建立新时代的社交。变I人为E人,帮助I人找到最适合ta的伙伴。
注:I 人E人分别对应MBTI人格测试中的两种大类型,I人指性格内敛,E人指性格外向,两者最大的区别是I人享受独处,E人更愿意通过社交吸取能量,也可以代入到之前很火的“社恐”和“社牛”概念里去理解。
大家可能还记得,社交在移动互联网时代诞生了各种陌生人社交产品,比如比如陌陌,豆瓣小组等,但最后发展起来的好像只有个人版的微信,企业版的钉钉。
他们这个idea 希望通过每个人的日常记录来总结出人的个性,匹配到合适的人去交往。和现在的小红书,抖音等关注型社交的区别是:日常的记录会更真实。但难点在于个人隐私如何保障。
线下和两位00后的创作者聊的时候,他们的思维让我觉得很赞。
“就是有一次在电梯里,当我遇到认识的人,就会和他们打招呼,但遇到不认识的人,就不会和他们打招呼,当时就在想,会不会在同一空间里正好错过了可能和你聊得来的朋友。”
如此简单的一个场景,能去思考,确实是我希望能有的状态。同时我也相信:AI时代确实会有新的社交诞生,想象空间最大的就在于一个人会有多个数字分身(AI agent),比如AI会以妈妈身份与孩子社交,以下属的身份与领导社交,以老板的身份与下属社交,以儿媳妇的身份与老人社交,但具体是什么形态,恐怕大家都在探索中。
这也是在这次Hackthon中唯一一个专注于社交的应用。创作者成员是一对双胞胎兄弟,他们也有自己的公众号:Geek Savvy,感兴趣的朋友可以关注一下。
最后和大家汇报一下我参赛的idea,没有获奖一点也不遗憾,因为确实做的不够好,但对我个人来说,已经是一次尝试了,未来争取做出更好的东西。
3. 我参赛的idea:入境诗画
我用DEMO中的一张图来说明。
我想大家也能感受到这是个什么样的idea,路演中评委(傅盛)的评价我觉得很中肯: “用AI做一个可以穷尽的内容(因为流行的古诗词可能也就那么几百首)是不如让人去做更合适的,因为AI目前的技术确实达不到插画师的水平”。所以“用AI绘画复现古诗词场景”其实是AI+人力来完成更有效。
另外一个难点是:用数字人和用户产生对话时,实时性目前难以保证。以目前的技术,如果让数字人的口型与文字能对上,生成一段视频的时间是很长的,比如我们使用的工具是2秒/字,这也是为什么数字人目前应用大多数用于播报和非常简短的应答,而不是实时对话。
因为上述两个原因,这个产品暂时不打算继续开发下去了。尽管没有获奖,但是结识了非常靠谱的开发朋友,也在这里把他的公众号(AI小智)推荐给大家,demo中的项目后端代码都是他写的,开发的朋友可以直接开聊了。
AGI的体会就这么多,后面还会尝试其他比赛,如果有信息,也希望你分享给我。如果你想参加(有点子,有领域知识或者技术都可以),也欢迎私信聊聊。
我是关注AI产品的产品二姐,致力于带来丰富的AI学习分享、体会,欢迎你和我一起学习,如果你觉得文章有用,欢迎关注、点赞、转发。
原创文章,作者:产品二姐,如若转载,请注明出处:https://www.agent-universe.cn/2023/12/8543.html