大模型日报(7月4日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(7月4日 资讯篇)

推特

01

Kyutai Labs端到端音频模型演示

Moshi 和 Alex 的太空冒险之旅 🚀

法国 AI 实验室 Kyutai 拥有 3 亿美元的资金,刚刚发布了开源的 GPT-4o 竞争者 Moshi。
Moshi 是一个实时多模态模型,可以听、听懂和说话。
代码、模型和论文将很快发布。
@kyutai_labs

大模型日报(7月4日 资讯篇)https://x.com/kyutai_labs/status/1808593149733781683

02

Thomas Wolf评论Kyutai Labs完全端到端音频模型演示:基本上,他们抓住了基本点。这项互动语音技术已经在这里了。它很快将成为一种显而易见的商品

今天,@kyutai_labs 的完全端到端音频模型演示是一个重大事件,很多人没有注意到。
基本不相关的事实是:
  • 他们的演示在 OpenAI ChatGPT-4o 发布几周后推出。
  • 演示的打磨程度不如 ChatGPT-4o(在语音质量、语音时间方面)。
相关的事实是:
  • 模型训练流程和模型架构简单且具有极大的可扩展性,像 Kyutai 这样的小团队(8 人以上)在 4 个月内就构建出来了。合成数据在这里起到了巨大的推动作用。
  • 专注于本地设备:Moshi 很快将无处不在。前沿模型构建者对让你本地运行小型模型的激励很低(每个 token 的价格……),但像 Kyutai 这样的非营利组织有着非常不同的激励机制。Moshi 的演示已经上线,而 OpenAI 的 4o 还处于未定状态。
  • 在保持 Llama 8B 或更高质量答案的同时,将延迟降低到 300 毫秒以下是互动性的关键推动因素,这是一个改变游戏规则的进展。当模型在你还没问完问题时就已经回答了,这种感觉非常奇妙,或者当你在模型说话时打断它,它能够做出反应……预测编码模型能够瞬间更新你要说的话……
基本上,他们抓住了基本点。这项互动语音技术已经在这里了。它很快将成为一种显而易见的商品。

大模型日报(7月4日 资讯篇)https://x.com/Thom_Wolf/status/1808532365720834085

03

GPT4All 3.0:开源本地 LLM 桌面应用程序

推出 GPT4All 3.0:开源本地 LLM 桌面应用程序
  • 完全私密的体验
  • 支持数千种模型和所有主流操作系统
  • 重大 UI/UX 改进
  • 本地文件聊天
  • MIT 许可证
点击下方开始使用:

大模型日报(7月4日 资讯篇)https://x.com/nomic_ai/status/1808162955806097767

04

扩散强制:统一了下一词预测和全序列扩散

介绍扩散强制(Diffusion Forcing),它统一了下一词预测(例如 LLMs)和全序列扩散(例如 SORA)!它在视觉和机器人领域提供了改进的性能和新的采样策略,例如稳定的无限视频生成、更好的扩散规划等!

大模型日报(7月4日 资讯篇)https://x.com/BoyuanChen0/status/1808538170067407264

05

Karpathy分享:玩转生成式 AI 工具,采用了《傲慢与偏见》的前几句话并将其制作成视频,这里有巨大的讲故事机会

我正在玩转生成式 AI 工具,并将它们拼接成视觉故事。在这里,我采用了《傲慢与偏见》的前几句话并将其制作成视频。
这次使用的生成栈包括:@AnthropicAI 的 Claude 处理了第一章,生成了场景和提供给图像生成器的单独提示。@ideogram_ai 根据提示生成了图像。@LumaLabsAI 将图像动画化。@elevenlabsio 提供了旁白。@veedstudio 将所有内容拼接在一起。
很多选择只是我在探索过程中刚好使用到的。说实话,这个过程相当混乱,在所有工具之间需要大量的复制粘贴,即使这个只有3个场景的小视频也花了我大约一个小时。
对于能够将这一过程变得方便的人来说,这里有巨大的讲故事机会。谁在打造第一个 100% AI 原生的电影制作工具?

大模型日报(7月4日 资讯篇)https://x.com/karpathy/status/1808686307331428852

06

Perplexity宣布 Pro Search 更新版本:多步骤推理、Wolfram|Alpha 和代码执行来进行更深入的复杂查询研究

我们很高兴地宣布我们的 Pro Search 更新版本,它可以通过多步骤推理、Wolfram|Alpha 和代码执行来进行更深入的复杂查询研究。

大模型日报(7月4日 资讯篇)https://x.com/perplexity_ai/status/1808183923064656383

产品

01

BuilderKit

Builderkit 是一个全面的 AI SaaS 代码样板,旨在帮助开发者快速构建和交付 AI 应用程序。它提供了大量的预构建工具和组件,包括 AI 模型集成、登录页面、身份验证等,大大加快了 AI 应用程序的开发速度。Builderkit 是基于创建者们之前成功交付 AI 产品的经验而开发的,因此能够帮助开发者避免重复造轮子,专注于自己的核心业务逻辑。
大模型日报(7月4日 资讯篇)https://www.builderkit.ai/
02

Skott

Skott 是 Lyzr 公司开发的一款 AI 驱动的社交媒体营销助手。它可以自主地生成大量博客和社交媒体帖子内容,一年 365 天不间断地产出 1000 多篇文章,无需人工干预。Skott 作为一个自主的 AI 营销人员,可以帮助用户进行高效的社交媒体营销。它集社交媒体营销、博客撰写和设计于一体,为用户提供全方位的自动化营销解决方案。
大模型日报(7月4日 资讯篇)https://www.lyzr.ai/skott/
03

Suno AI iOS 版本

Suno AI 的手机版本上线了,让制作音乐更加便捷 !
大模型日报(7月4日 资讯篇)https://apps.apple.com/us/app/suno-make-and-explore-music/

投融资

01

硅基流动完成近亿元融资:加速生成式AI技术普惠进程

硅基流动(SiliconFlow)近日完成近亿元人民币的天使+轮融资,由知名产业方领投,跟投方包括智谱AI、360和水木清华校友基金等,老股东耀途资本继续超额跟进,华兴资本担任独家财务顾问。此次融资将用于加速生成式AI基础设施(AI Infra)平台的开发和市场推广,进一步降低AI应用的开发和使用门槛,推动AI技术的普惠化。创始人兼CEO袁进辉表示,此次融资将助力硅基流动加快产品创新,为开发者提供高效能、低成本的AI云服务。
大模型日报(7月4日 资讯篇)https://mp.weixin.qq.com/s/aZIIQUqEi0zzY5JSJ6Fzgw
02

Altrove 利用AI模型和实验室自动化技术创造新材料

法国初创公司Altrove致力于通过AI模型和实验室自动化技术推动新材料的研发。该公司已经筹集了370万欧元(约合400万美元)的资金,由Contrarian Ventures领投,Emblem参投。其他投资者包括Owkin CEO Thomas Clozel、Hugging Face CTO Julien Chaumond和3Shape创始人Nikolaj Deichmann。Altrove计划在年底前建成自动化实验室,并在18个月内推出首个产品。
公司官网:https://altrove.ai/
大模型日报(7月4日 资讯篇)https://techcrunch.com/2024/07/03/altrove-uses-ai-models-and-lab-automation-to-create-new-materials/
03

「傲鲨智能」完成数千万元A+轮投资,千元级外骨骼走进消费级市场

通用型外骨骼机器人研发商傲鲨智能宣布完成数千万元A+轮融资,由敦鸿资产领投。本轮融资将用于加速千元级外骨骼产品和“具身智能”通用人形机器人与外骨骼结合形态的初步产品发布。傲鲨智能成立于2018年,专注于外骨骼机器人研发,计划在2024年底推出面向老年人和社区护工的民用产品,并扩大东南亚和欧洲市场的业务。
大模型日报(7月4日 资讯篇)https://mp.weixin.qq.com/s/tzv0QJcDdLgW70deFDQyWg
04

CreativeFitting获百度Pre-A+轮融资,加速AI原生应用发展

全球首款AI短剧APP Reel.AI在海外市场发布后表现亮眼,其背后的公司CreativeFitting(井英科技)完成了由百度集团投资的数百万美元Pre-A+轮融资。本次融资将用于升级视频模型和工具,强化内容生态系统建设,推动Reel.AI在AI+娱乐领域的持续创新。创始人兼CEO朱江表示,融资不仅是对团队和产品的认可,更是对AI原生应用前景的肯定。
公司官网:https://www.creativefitting.ai/
大模型日报(7月4日 资讯篇)https://www.creativefitting.ai/p76.html
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/07/14287.html

Like (0)
Previous 2024-07-04 17:52
Next 2024-07-05 11:17

相关推荐

  • 大模型日报(7月16日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-16
    242
  • 大模型日报(6月1~2日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-06-02
    212
  • 大模型日报(3月28日)

    特别活动! 欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 Databricks上线DBRX…

    2024-03-28
    163
  • OpenAI o1横空出世,让我们看看都有哪些训练大模型的代码开源数据集

               OpenAI o1强力袭来     当地时间9月12日,OpenAI正式发布OpenAI o1。全新命名的o1系列包含了OpenAI o1、OpenAI o1…

    2024-09-14
    421
  • 大模型日报(4月16日 资讯篇)

    欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 第一个超越GPT-4的开源模型!Wizard…

    2024-04-16
    124
  • 大模型日报(8月15日 资讯篇)

    特别活动! 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.f…

    2024-08-15
    207
  • 「草莓」OpenAI o1大模型信号看板大汇总!!

    贡献人:Angela、naixu、Alex、zechen、常楠、智勇、Ollie  Introduction 导引 2024年9月13日凌晨, OpenAI 震撼发布🍓「草莓」o1…

    2024-09-19
    427
  • 大模型日报(五一特刊 5月1-5日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-05-05
    117
  • 大模型日报(8月3~4日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-04
    219
  • 火爆CV圈的SAM是什么?

    01 SAM是什么 前言 最近几周,人工智能的圈子里都在讨论SAM(Segment Anything Model),一个号称(零样本)分割一切的图像分割模型。 图:Segment …

    2023-05-19
    156