大模型日报(8月15日 资讯篇)

特别活动

大模型日报(8月15日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(8月15日 资讯篇)

资讯

01

创业一年,人间三年

李沐在文章中分享了他创业一年的经历,体验到了时间的加速效应,感觉像是人生中经历了三年。他谈到了命名公司时的困惑与灵感,融资过程中的起伏,以及 GPU 采购时的挑战与成功。在商业和技术层面,他强调了自定义大型语言模型(LLM)的重要性,以及公司在行业中的定位和发展。同时,他也反思了如果更加积极地融资,可能会获得更多资金的机会。技术上,他描述了对 LLM 认知的四个阶段,从最初的震撼到后来的深入研究和定制模型的成功,最终实现了与行业领头羊相当甚至更优的技术水平。最后,李沐提出了他对未来智能体的愿景,即作为人类的陪伴,不仅具备高情商和智商,还能够提供情感和知识上的支持。他认为,生产工具的发展将使人类更加个体化和独立,而智能体能够填补这种孤独带来的空缺。在团队和个人追求方面,他强调了团队的重要性以及内心动机对于创业成功的影响。
大模型日报(8月15日 资讯篇)https://zhuanlan.zhihu.com/p/714533901?utm_psn=1807446872983478272
02

GitHub 全球宕机,Copilot 瘫痪!开发者光明正大摸鱼

GitHub 近期遭遇全球性宕机,影响了其网站及多项服务,包括 Copilot,虽后续系统恢复正常。宕机期间,用户无法访问主网站,显示错误消息。受影响的服务包括 pull requests、GitHub Pages 和 API。事件迅速扩散,超过 1 万用户受牵连。GitHub 在 2018 年被微软收购,用户数从不到 4000 万增长至 7300 多万,但宕机事件频发,尤其在 2018 年和 2021 年发生了严重的中断,导致开发者对 GitHub 的信任下降。用户通过社交平台表达了对 GitHub 服务不稳定性的不满,认为即使是短时间的中断也是不可接受的。
大模型日报(8月15日 资讯篇)https://mp.weixin.qq.com/s/wweSVOjs1jCZLWKPpKMdDA
03

ACL主席:ACL不是AI会议

ACL 主席 Emily M. Bender 在 ACL 2024 大会上指出,ACL 大会是计算语言学和自然语言处理领域的顶级国际会议,而非 AI 会议。她强调 ACL 的核心在于语言技术和计算语言学,并批评了 AI 领域的一些不良研究实践,如过度追求与 SOTA 模型的比较评估和基准测试的不当使用。Bender 主张 CL/NLP 研究应关注技术的适用性、对人类语言行为的理解、以及科学研究的可复制性和可重现性。她认为 ACL 应该是一个促进跨学科研究、关心语言群体的平台,并提供对社会影响的理性讨论。这一观点引发了社交平台上的广泛讨论,有人认为这种分割没有必要,而另一些人则理解 Bender 的立场,担心 AI 的风头可能会使其他领域的研究受到冷落
大模型日报(8月15日 资讯篇)https://mp.weixin.qq.com/s/9M50mfCiH3HF-UzKTRsLgA
04

ACL 2024大奖揭晓!全华人团队用AI破解3000年前甲骨文密码

ACL 2024 大会揭晓了多项关键研究成果,特别是全华人团队利用扩散模型成功破译 3000 年前甲骨文的工作。该团队开发了「Oracle Bone Script Decipher」(OBSD),通过基于条件扩散的策略生成了破译线索,为古代语言分析提供了新方法。此外,研究人员还探讨了大型语言模型的记忆特性,发现模型的记忆性能随模型大小、数据顺序和学习率而变化,且具有一定的可预测性。Cohere 公司发布的 Aya 模型覆盖了超过 101 种语言,显著超越了现有开源模型,为多语言语言模型的研究提供了新的基准。另一研究探讨了 Transformer 模型在学习复杂函数时的偏差和局限性,指出这些偏差与模型的损失景观密切相关。
大模型日报(8月15日 资讯篇)https://mp.weixin.qq.com/s/CJEDRuEb19buOOk4FsvQNQ
05

Chrome安卓或遭剥离,AI训练数据被迫共享

谷歌可能因违反反垄断法而面临分拆,包括与 Chrome 和安卓操作系统的解绑,以及被迫共享 AI 训练数据。这将是自 80 年代 AT&T 分拆以来最重大的企业分拆。谷歌搜索引擎市场份额约为 91%,长期保持在约 90%,而次一位的微软 Bing 仅占不到 4%。谷歌通过与苹果、三星等公司的协议,将其搜索引擎作为默认选项预装于设备上,维持其市场霸权。美国司法部胜诉,联邦法官裁定谷歌违反反垄断法,可能导致谷歌剥离安卓或 Chrome 浏览器。此外,司法部考虑要求谷歌与竞争对手分享数据,以促进市场公平竞争。如果分拆执行,将对谷歌的广告业务和市值产生深远影响。谷歌还可能被迫出售 AdWords 广告平台,或者提供互通操作,使其在其他搜索引擎上可用。此外,谷歌可能需要为其 AI 产品和搜索新功能的开发提供解释,以抵御垄断争议。
大模型日报(8月15日 资讯篇)https://mp.weixin.qq.com/s/16ig3q2jkR7kevfHJ7wfHg
06

专访大象机器人 CEO 宋君毅:从机械臂到轮式人形机器人,差异化才能突围

大象机器人 CEO 宋君毅在机器人领域的创业旅程,从 2016 年开始,经历了从工业机械臂到轻量型机械臂、机器宠物,再到人形机器人的多次业务转型。他坚持技术自研,不断调整产品布局,以适应市场需求和竞争环境。在 2020 年,推出的桌面级六轴机械臂 myCobot 使公司实现了亏转盈。随后,公司扩展了轻量级机械臂和机器宠物系列,并在 2024 年全面布局人形机器人。宋君毅认为,人形机器人的未来市场前景广阔,重点在于性价比和应用场景的拓展。通过深入理解用户需求,大象机器人致力于推动人形机器人的商业化落地,以实现公司的持续发展和转型。
大模型日报(8月15日 资讯篇)https://mp.weixin.qq.com/s/sU2ZrURDVUd-91rHoeUuQw

推特

01

AI + Web3初创Sahara AI 融资4300万美元:带入一个开放、公平、安全的AI未来

Sahara AI成功筹集了4300万美元,用于构建协作型AI经济体!
由@PanteraCapital、@BinanceLabs 和 @polychain 共同领投,此次融资将我们带入一个开放、公平、安全的AI未来,通过我们的去中心化AI区块链平台实现。
我们还看到了来自@SamsungNext、@Sequoia、@matrixvc、@daofive、@geek_cartel、@NomadCapital_io、@SCB10X_OFFICIAL、@CanonicalCrypto、@mirana、@ForesightVen、@aegis_ventures、@DispersionVC、@tangent_xyz、@alumniventures等的参与。
此外,我们很自豪能够得到AI领域最聪明的头脑的支持,包括:
  • 来自@MothersonGroup 的 Laksh Vaaman Sehgal
  • 来自@AnthropicAI 和 @StanfordAILab 的 Rohan Taori (@rtaori13)
  • 来自@NousResearch 的 Teknium (@Teknium1)
  • 来自@togethercompute 的 Vipul Prakash (@vipulved)
  • 来自@midjourney 的 Elvis Zhang (@elvzhangg),等等
无论你是AI爱好者、数据科学家、商业领袖,还是对技术改变世界的潜力充满热情的人,协作型AI经济体都有你的一席之地!
阅读更多关于如何加入我们的使命:
http://saharalabs.ai/blog/sahara-ai-raise-43m

大模型日报(8月15日 资讯篇)https://x.com/SaharaLabsAI/status/1823708561517764866

02

Anthropic大更新:Claude可以进行提示缓存,使用更长、更具指导性的提示即时微调模型响应

使用Claude进行提示缓存。
缓存允许您使用更长、更具指导性的提示即时微调模型响应——同时最多减少90%的成本。
现在在Anthropic API的测试版中可用。
大模型日报(8月15日 资讯篇)https://x.com/AnthropicAI/status/1823751314444021899
03

《提高LLM应用的准确性》:创建评估数据集来测量模型准确性、添加提示工程和自我反思、微调模型等

学习一种开发模式,以系统地提高LLM应用的准确性和可靠性,在我们的新短期课程中,与@LaminiAI和@Meta合作建立的《提高LLM应用的准确性》,由Lamini的CEO @realSharonZhou 和Meta的合作工程高级总监 @asangani7 教授。(披露:我是Lamini的投资者。)
调整LLM应用的路径可能很复杂。在这门课程中,你将学习一系列系统的步骤来提高准确性,通过减少幻觉:
•        创建评估数据集来测量模型准确性
•        添加提示工程和自我反思
•        微调你的模型,包括“记忆调整”,这是一种在LLM中嵌入事实的新方法
使用Llama 3-8B参数模型,你将:
•        构建一个具有自定义模式的文本到SQL代理,并模拟它产生幻觉的情况
•        理解指令微调与记忆微调的区别,指令微调是对预训练LLM给出遵循的指令
•        了解如何通过性能高效的微调(PEFT)技术,如低秩适应(LoRA)将训练时间减少100倍,以及记忆专家混合(MoME)进一步减少训练时间
我很欣赏Meta发布了Llama的开放模型家族——这门课程展示了开发者可以用这些模型做的独特类型的工作。

大模型日报(8月15日 资讯篇)https://x.com/AndrewYNg/status/1823759268937650528

04

Bihan分享语音到语音管道迭代:延迟可达500毫秒

介绍我们的第一个语音到语音管道迭代 🗣️。
选择你想要的LLM,并与之对话,延迟可达500毫秒!谁说我们需要语音到语音模型快速呢?

大模型日报(8月15日 资讯篇)https://x.com/eustachelb/status/1823817160210440196

05

3D导出功能:将任何图像转换为3D资产

在 @everartai 上推出3D导出功能 🧊
现在,您可以将任何图像转换为3D资产,以便与您喜爱的工具一起使用。
此视频中的生成是实时的。
就是这么快。⚡️
结合使用FLUX 1. Pro,您将获得一款适用于任何类型资产的惊人工具。

大模型日报(8月15日 资讯篇)https://x.com/skirano/status/1823778193972576521

06
Subform:用于分支和混合AI聊天的画布

介绍Subform——一个用于分支和混合AI聊天的画布。
仅用两周时间和400美元的Claude积分,加上血汗和泪水就构建完成

大模型日报(8月15日 资讯篇)https://x.com/bnj/status/1823784845879005407

产品

01

GCA

GCA(GPT 计算机助手)是一个开源框架,帮助用户为产品创建高度自定义的智能系统,支持 Windows、Linux 和 MacOS。它提供丰富的 API 和代理基础设施,适用于 B2B SaaS、电子商务和开发工具等多种场景,能够快速响应用户需求,提升 AI 输出质量,推动 AI 技术的民主化。
大模型日报(8月15日 资讯篇)https://gca.dev/
02

ToonTalk

ToonTalk 是一款专为儿童设计的 AI 朋友,能够分享有趣的故事、回答孩子的疑问,并鼓励语音互动,减少屏幕时间。它具有安全性和教育性,提供父母控制功能,帮助家长更好地理解孩子的情感和需求。
大模型日报(8月15日 资讯篇)
大模型日报(8月15日 资讯篇)https://flux-ai.io/flux-ai/

投融资

01

李飞飞创立的AI初创公司World Labs获1亿美元融资,估值超10亿美元

著名斯坦福大学AI教授李飞飞创立的World Labs在成立仅四个月内获得了两轮融资。最新一轮融资由NEA领投,金额达1亿美元,使公司估值超过10亿美元。此前的第一轮融资在4月份进行,估值为2亿美元,投资方包括Andreessen Horowitz和Radical Ventures。World Labs致力于开发三维物理建模的AI技术,用于游戏和机器人领域。
大模型日报(8月15日 资讯篇)https://techcrunch.com/2024/08/14/nea-led-a-100m-round-into-fei-fei-lis-new-ai-startup-now-valued-at-over-1b/
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/08/13610.html

Like (0)
Previous 2024-08-15 13:58
Next 2024-08-16 18:17

相关推荐

  • 大模型日报(5月29日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-05-29
    129
  • 大模型日报(4月19日 资讯篇)

    欢迎观看大模型日报,进入大模型日报群和空间站(活动录屏复盘聚集地)请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 Shumer评价LlaMA…

    2024-04-19
    141
  • 大模型日报(8月23日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-23
    230
  • 大模型日报(7月1日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-01
    172
  • 草莓的真面目终揭开,OpenAI o1 全方位解析!

    北京时间凌晨一点左右,OpenAI o1 横空出世,即是之前宣传已久的草莓模型。 “突来的消息,那个模是你,这么多天你杳无音讯…” 特工们也第一时间被推送到了新模型,这…

    2024-09-13
    347
  • The theory of LLMs|朱泽园ICML演讲整理

    编者:Ollie Li 视频原链接:https://www.youtube.com/watch?v=yBL7J0kgldU 欢迎大家观看原版视频。本文仅供学习。如有侵权,请联系我们…

    2024-08-28
    262
  • 「创业空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    我们专注于跟进前沿技术,旨在让这次AI的进步为所有愿意创造的人共享。最近我们梳理了AI战略方向的框架性认知(非常可读,已经过数位小白及学者级读者检验),处于小范围分享状态,如果您感…

    2024-07-11
    225
  • 大模型日报(8月17~18日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-18
    223
  • 大模型日报(6月20日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-06-20
    129
  • 大模型日报(6月18日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-06-18
    152