我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
推特
Kyutai Labs端到端音频模型演示
https://x.com/kyutai_labs/status/1808593149733781683
Thomas Wolf评论Kyutai Labs完全端到端音频模型演示:基本上,他们抓住了基本点。这项互动语音技术已经在这里了。它很快将成为一种显而易见的商品
-
他们的演示在 OpenAI ChatGPT-4o 发布几周后推出。 -
演示的打磨程度不如 ChatGPT-4o(在语音质量、语音时间方面)。
-
模型训练流程和模型架构简单且具有极大的可扩展性,像 Kyutai 这样的小团队(8 人以上)在 4 个月内就构建出来了。合成数据在这里起到了巨大的推动作用。 -
专注于本地设备:Moshi 很快将无处不在。前沿模型构建者对让你本地运行小型模型的激励很低(每个 token 的价格……),但像 Kyutai 这样的非营利组织有着非常不同的激励机制。Moshi 的演示已经上线,而 OpenAI 的 4o 还处于未定状态。 -
在保持 Llama 8B 或更高质量答案的同时,将延迟降低到 300 毫秒以下是互动性的关键推动因素,这是一个改变游戏规则的进展。当模型在你还没问完问题时就已经回答了,这种感觉非常奇妙,或者当你在模型说话时打断它,它能够做出反应……预测编码模型能够瞬间更新你要说的话……
https://x.com/Thom_Wolf/status/1808532365720834085
GPT4All 3.0:开源本地 LLM 桌面应用程序
-
完全私密的体验 -
支持数千种模型和所有主流操作系统 -
重大 UI/UX 改进 -
本地文件聊天 -
MIT 许可证
https://x.com/nomic_ai/status/1808162955806097767
扩散强制:统一了下一词预测和全序列扩散
https://x.com/BoyuanChen0/status/1808538170067407264
Karpathy分享:玩转生成式 AI 工具,采用了《傲慢与偏见》的前几句话并将其制作成视频,这里有巨大的讲故事机会
https://x.com/karpathy/status/1808686307331428852
Perplexity宣布 Pro Search 更新版本:多步骤推理、Wolfram|Alpha 和代码执行来进行更深入的复杂查询研究
https://x.com/perplexity_ai/status/1808183923064656383
产品
BuilderKit

Skott

Suno AI iOS 版本

投融资
硅基流动完成近亿元融资:加速生成式AI技术普惠进程

Altrove 利用AI模型和实验室自动化技术创造新材料

「傲鲨智能」完成数千万元A+轮投资,千元级外骨骼走进消费级市场

CreativeFitting获百度Pre-A+轮融资,加速AI原生应用发展

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/07/14287.html