我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
资讯
斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」

瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破

告别偏科,能玩转多模态、多任务、多领域的强化智能体终于来了

12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场

Anthropic 终于推出企业版以及 iOS 应用!全面对标 OpenAI

Perplexity CTO 最新复盘:软件利润开始变厚,不排除广告收入,但 Perplexity 可能不会像谷歌那样成功

爆款生成式AI硬件,销量突破10万台,拆完一看只是安卓app?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

推特
Karpathy:大型语言模型终将在太空中运行

Jim Fan:三种类型的大型语言模型评估
-
私有测试集但公开报告成绩,由一个不推广自己的LLM的可信第三方进行。@scale_AI 的最新 GSM1k 就是一个很好的例子。他们是一个公正无偏的中立方,确保测试数据不会泄露到任何人的训练中。 -
公开的比较基准,如 @lmsysorg 聊天机器人竞技场,以ELO分数报告。你不能操纵民主。 -
每个公司为自己的用例精心策划的私人基准。你不能操纵你的客户。
https://x.com/DrJimFan/status/1786054643568517261
苹果或将推出人工智能功能,随iphone16发布

Google AI:扩展层次聚类算法以处理万亿边的图
https://x.com/GoogleAI/status/1785763979748601888
Chip Huyen:开源模型和商业模型时需要考虑的事项
-
数据隐私:员工可能会在提示中无意中包含机密信息,例如当三星员工使用ChatGPT泄露公司机密时。 -
功能性:商业模型更有可能支持函数调用和JSON模式。然而,大多数模型提供商没有或只有限制的提供 logprobs API。Logprobs 对于分类任务、置信度评分和可解释性很有用。 -
API成本:大规模时API调用可能变得昂贵。 -
微调:模型提供商可能不允许你对他们的模型进行微调。现成的商业模型可能更适合你的使用案例,但可能不如开源+微调好。 -
控制和透明度:在模型更改、版本和路线图方面缺乏透明度。有一天你的提示可能无法按预期工作,而你不知道为什么。模型提供商可以决定停用你正在使用的模型,你需要时间适应新模型。 -
边缘使用案例:无法在没有互联网连接的设备上工作。
-
数据来源/版权:人们不太可能因为在受版权保护的数据上训练而起诉开源模型构建者。然而,如果你使用这些模型赚钱,你可能会遇到麻烦。 -
功能性:托管你的模型可以让你访问logprobs和其他中间输出。有些外部工具为某些开源模型提供函数调用和受限采样,但这些功能可能有限。 -
工程成本:托管、优化和维护大型模型需要不小的时间、才能和努力。如果支持你想使用的模型,这可以通过使用模型托管服务来缓解。 -
微调:理论上,你可以对开源模型进行微调,但这可能不容易做到。

Raschka分享笔记本代码:微调一个小型GPT模型,以约96%的准确率分类垃圾信息

大型科技公司2023年的人工智能投资图表

产品
Loom AI

Mindtrip

Claude for ios

WIZPR RING

Otterly AI

WaxWing

Pressmaster.ai

Synthesia

Lamini筹集2500万美元以帮助企业内部开发顶级LLM

Allozymes通过其加速酶学技术进行数据和AI方向的运用,筹集1500万美元

大模型日报16
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/05/15607.html