第一手内测!智谱最新的「AI 视频通话」真实效果如何? 特工宇宙 • 2024-08-30 15:18 • 产品 • 515 views 作者|特工十五、特工小鹏 编辑|特工少女 昨天,在 KDD 国际数据挖掘与知识发现大会上,智谱宣布「清言」App 迎来了重要更新,上线了「AI 视频对话功能」。 据报道,该功能还是国内首个面向 C 端开放的。 相信不少朋友的朋友圈被下面这条视频刷了屏。 看完了视频的我直呼离谱,智谱这是要将「对标 OpenAI」进行到底啊! 至于真实实力如何?到底像不像演示中的那么炸裂? 实践出真知,特工宇宙有幸拿到了内测资格,替大家体验测试一番。 先来个省流版:综合体验下来的主观感受是,屏幕那头的 AI 像是个 T 型人格的「淡人」,语气没有任何机械感,情绪稳定到泰山崩于前而面不改色,温柔文静又不失特工少女般的落落大方,那扑面而来的抑扬顿挫,就像那一朵水莲花不胜凉风的娇羞。 此外,多模态理解能力还是挺能打的,在部分场景上的识别和解答都表现不错,对话响应速度还是比较快的,大概在 1-2s 左右,并且支持插话打断。 除了在一些较复杂刁钻的问题上的表现稍有逊色之外,其余回答基本上都达到了预期。虽然效果没有非常惊艳,但是也足够让人眼前一亮,如此也确实配得上「国内首个」的名号。 这一次,智谱离「让机器像人一样思考」,更近了一步。 特工宇宙的小伙伴连夜录制了测试视频(虽然略显朴素,但是足够真实)。 让我们一起来看看。 第一个测试了下基础的多模态识别能力,可以看到 AI 较为准确地识别到了小猫以及它的一些样貌姿态(不知道为啥选这个 Case,可能是想晒下猫猫? 第二点就还蛮让人惊喜的,我看其他测评的没怎么提到,就是下一次唤起视频对话时,有概率 AI 会回顾之前的对话内容作为开场白。 比如视频中,我们再次打 Call 时,她还记得我们的小猫猫。 第三个,我们复刻了发布会中你画我猜的「画蛇添足」,结果也回答正确(不是哥们,画的稍微有点抽象了哈) 第四个,做了几个小学数学题也答对了(还挺有意思的是,她知道了答案但不直接告诉你,有点一步步引导你的感觉) 第五个,整了个复杂的,AI 正确的识别出一共有 20 款微缩玩具,英文也说的挺溜(没错咱们办公室确实有很多好玩的东西) 第六个做了个穿搭测试,什么衣服裤子配这顶帽子呢?回答的也不错。 不过把 ST.MORITZ(圣莫里茨,瑞士一度假小镇)中的 Z 识别成了 2,但也无可厚非,确实很容易看错。 此外,我们还挖掘了许多有趣的场景,由于篇幅有限便不再赘述,感兴趣的朋友可以在清言 APP ,或者登录 PC 端(chatglm.cn),申请内测。 除了 AI 视频通话功能以外,继 GLM-4-Flash 完全免费之后,在这次大会,智谱还推出了推出了新一代全自研基座大模型 GLM-4-Plus. 性能全面提升,拥有更强的长文本处理和多模态能力。 能力有提升多少呢?据官方表示,在语言文本能力方面,GLM-4-Plus 和 GPT-4o 及 Llama 3.1 405B 相当。 LCB: LiveCodeBench NCB: NaturalCodeBench 此外,还有图像/视频理解模型 GLM-4V-Plus,和文生图模型 CogView-3-Plus. 前者或是国内首个通用视频理解模型 API,后者据说也能达到当前最优的 MJ-V6 和 FLUX 等模型的效果。 而这全新的三个模型,也都同步上线了智谱的 Bigmodel 开放平台,可以在线体验或直接调用 API 测试。 在这一点上,智谱就比 OpenAI 实诚多了,有啥好东西它是真的直接开放。 BTW,在测试的过程中我萌生了一个不怎么搭边的小问题。 就是咱这个形象为什么是个「大象」? 我突然想到 GLM 大模型的 Logo 好像就是一只大象。 我仔细盯着这 Logo 半天,似乎发现了里面的一些玄机。 白色区域原来是个 G 和 L,整只大象组成了个 M,由此代表了 GLM,然后为什么选择大象呢,我猜测是源自智谱的 Slogan,让机器「象」人一样思考。 起初的我不觉明厉,但顿悟的我拍案叫绝。 One more thing,OpenAI 这两天又在聊新的融资,市值最高的三家公司苹果、微软、英伟达正在洽谈参与投资,OpenAI 的估值将超过 1000 亿美元。 那么,祝愿全面对标 OpenAI 的智谱,也能蒸蒸日上。 原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/08/2472.html Like (0) 0 Generate poster 关于作者 特工宇宙 大模型日报(8月29日 学术篇) Previous 2024-08-30 01:10 AI编程,10小时2个产品,从Claude Sonnet到Cursor,产品经理的天要变了! Next 2024-08-30 17:45 相关推荐 产品 95 后创始人领跑 GenAI 应用革命:2024 美国新晋独角兽观察 Z Talk 是真格分享认知的栏目。 2024 年,全球共有 140 家公司跻身独角兽。年前,真格基金发布了「2024 年中国新晋独角兽研究报告」。 本期内容,我们对美国… 2025-02-26 740 产品 大模型日报(1月21日 学术篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2025-01-21 780 产品 链宇科技秦宇迪:97 年清华本博两次连续创业,从兴趣团队到新能源硬科技创始人|Z Talk 2024-10-23 780 产品 98 年 AI 女博士创业,用 LPA 做真正为人类创造价值的 AI 作者|特工小天 编辑|特工少女 这波 AI 浪潮,90 后可以说是顶起了半边天。 月之暗面的杨植麟,智元机器人的彭志辉,Meshy 的胡渊鸣,面壁智能的曾国洋… 而在他… 2024-07-31 3310 产品 Level Up!真格AI游戏黑客松等你来战 生成式 AI 热潮席卷全球,ChatGPT 展现出来强大的理解和推理能力,使其在游戏领域的应用有着巨大的想象空间。 AIGC 可以在游戏领域的多个环节施展魔法——无论是游戏前的美术… 2023-05-30 960 产品 妙鸭9.9元收费背后:解析AIGC产品的商业本质(5000字) AIGC 的产品第一天不收钱,就可能收不到钱! 最近看极客公园访谈妙鸭产品负责人的文章,标题就很有意思。 妙鸭开始采用9.9元前置收费后,会成为AI产品的标准玩法吗?今天我们一起来… 2023-08-09 1510 产品 论文阅读大作战:AI产品经理的必备技能还是时间陷阱?| 5000字 前阵子42章经的一期播客:《一个顶级AI产品经理的自我修养 | 对谈光年之外产品负责人Hidecloud》引起了巨大的反响,很多的PM开始亚历山大:不行不行,我要赶紧开始刷论文了!… 2024-04-16 2120 产品 尴尬的面包多,文艺的6pen,不明的前景 | AI系列03(4500字) (使用标题文字,禅定模式,SD模型,在6pen中付费生成的图片) 上图是6pen社区里一个正在开放中的展览,主题为“冲浪网名大作战”,根据描述,是官方受到网友用AI画自己网名的启发… 2022-10-24 1070 产品 当代年轻人,用 AI 发神经 去年年底,喜剧《年会不能停》对职场的讽刺,直击无数年轻人的敏感神经。 影片中一首改编的《我的未来不是梦+打工人之歌》,唱出了打工人们的心声。兢兢业业的胡建林,被职场磨平棱角任劳任怨… 2024-10-21 720 产品 对赌 4 年后再 AI 创业:一家数据创业公司的收购始末 2019 年底一个寒冷的清晨,任栋霓 Tony 在一叠叠厚重的协议文件上签下最后一个名字。从公司初创时的起名,到并购文件上的最后一个签名,这个过程仿佛只用了一瞬间。 这一刻,他把博… 2024-11-12 690