我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!

资讯
ChatGPT登陆Windows,推出预览版应用
OpenAI近日宣布,ChatGPT的专属Windows应用开始预览,目前仅向ChatGPT Plus、Team、Enterprise和Edu用户开放。这款预览版应用为用户提供了与文件和图片交互的功能,并集成了OpenAI最新的o1-preview模型。
该应用适用于大多数Windows 10设备,但与其他ChatGPT客户端相比,目前功能尚不完善。例如,暂不支持语音模式及与OpenAI GPT Store的部分集成功能。不过,用户可以像在macOS版一样,将应用最小化为一个小“伴侣”窗口,便于在其他应用程序运行时使用。同时,它支持文件和图片上传、文档摘要生成,以及通过DALL-E 3生成图像。
OpenAI表示,今年晚些时候将推出该应用的完整版本,为用户带来更全面的使用体验。
官网链接:https://help.openai.com/en/articles/9982051-using-the-chatgpt-windows-app
https://techcrunch.com/2024/10/17/chatgpt-comes-to-windows/
特斯拉机器人能自己走,“不是远程遥控”
特斯拉发布了擎天柱机器人(Optimus)的最新演示视频,展示其自主能力。视频中,Optimus在工厂内自主移动,能抱起11kg的重物,进行自主充电,还爬楼梯和分享零食。特斯拉强调,此次展示并非远程操控。Optimus的自主导航依靠2D摄像头和云端存储的视觉特征,而不依赖GPS。这段展示发布后,引发了质疑,有参会者表示机器人部分依赖远程操控,甚至直接询问了机器人,得到了“部分依赖”这样的回答。特斯拉随后发布视频,进一步展示Optimus的自主能力,工程师明确表示没有远程控制。此外,Optimus的自动充电技术也引发了网友的兴趣。
与此同时,国内的宇树科技更新了其G1人形机器人,创造了跳跃距离超过身高的纪录,略微抢走了Optimus的风头。然而,尽管有质疑声,很多人对特斯拉的未来表现充满期待。
Transformer成功寻找新的李雅普诺夫函数,三体问题相关
Meta和巴黎理工学院团队利用Symbolic Transformer模型,提出了新的方法来解决长期悬而未决的数学难题——寻找动力系统的全局李雅普诺夫函数。李雅普诺夫函数能够判断系统的稳定性,但如何构造该函数一直是个难题。团队将问题建模为符号序列翻译任务,使用Transformer模型进行训练,取得了突破性成果。
通过在8张V100 GPU上训练,模型对小规模多项式系统的求解精度达到84%,远超人类专家的9%。在面对随机生成的多项式系统时,模型成功找到了10.1%-11.8%的李雅普诺夫函数,而现有算法的成功率仅为0.7%-1.1%。此外,模型还能够发现此前未被发现的非多项式李雅普诺夫函数,表现远超传统工具。
为训练模型,团队生成了多个数据集,并结合了正向和反向数据生成策略。正向生成基于平方和李雅普诺夫函数,而反向生成则通过从李雅普诺夫函数推导系统。经过优化,该模型在混合数据集上表现优异,尤其是在宽度为50的Beam Search情况下,性能提升显著。最终,Transformer模型的推理速度远超传统的SOSTOOL算法。
这项研究表明,AI模型能够在合成数据上自动发现李雅普诺夫函数,为解决动力系统稳定性问题提供了新的可能性。这一成果已入选NeurIPS 2024,并有望推动数学界的进一步研究。
https://mp.weixin.qq.com/s/jgb5b04DODrloOylQJO_iw
Google NotebookLM推出定制音频会话功能,并启动商业试点计划
Google于近日更新了其AI笔记和研究助手NotebookLM的音频总结功能,允许用户定制AI生成的音频会话,并专注于特定话题,而非仅生成整体概述。这一更新使得用户可以通过“自定义”控制按钮引导音频会话,更精准地提取重点内容。
NotebookLM的音频概述功能于上月推出后迅速吸引了用户注意,许多人在社交媒体上分享通过该功能生成的音频内容,推动了NotebookLM网站访问量的371%增长,9月月访问量达到了307万次。此次功能升级旨在解决生成内容可能偏离重点的问题,并减少AI“幻觉”现象,即生成不准确的内容。
除了个性化音频总结,NotebookLM还推出了后台播放功能,允许用户在音频播放时继续使用其他功能,如查询来源、引用信息等。随着NotebookLM用户基础的扩大,Google宣布启动NotebookLM商业试点计划,超过8万家企业可以申请参与,并获得产品早期功能、培训和支持服务。
虽然具体的商业化细节和定价尚未公布,但Google计划在今年晚些时候进一步披露。此外,NotebookLM团队还在积极探索推出移动应用、支持更多语言和音色等功能,以进一步扩大其用户群体。
https://techcrunch.com/2024/10/17/googles-notebooklm-now-lets-you-guide-ai-generated-audio-conversations-launches-business-pilot/
推特
NotebookLM新更新:给主持人传递便条、最小化
🎧 给主持人传递便条——你现在可以在“音频概览”中点击“自定义”,以提供额外的指示,例如关注特定主题、来源,甚至调整适合的受众。
🎧 你现在可以最小化 Notebook 指南并使用聊天或其他功能,同时音频概览将在后台继续播放。
💼 超过 80,000+ 的组织已经在使用 NotebookLM。今天我们宣布推出 NotebookLM 商业版:即将通过 Google Workspace 提供的版本,具有为企业、大学和组织设计的增强功能。你可以申请 NotebookLM 商业版试点项目以获得早期访问。
🚀 现在拥有数百万用户,达成质量和产品里程碑,今天我们正式移除产品的“实验性”标签。这是一个令人兴奋的里程碑——真是不可思议的旅程!
@我并分享你们最好的自定义功能——你们的创意比我强太多了 😆
https://x.com/raiza_abubakar/status/1846944566689353838?s=46&t=GRStLXDcUNuun8J5Noyw4Q
Simon Willison分享:使用屏幕捕捉工具0.0008刀提取JSON数据
我需要从收件箱中的十几封电子邮件获取信息……所以我运行了一个屏幕捕捉工具,点击查看了每封邮件,然后使用 Gemini 1.5 Flash 多模态 LLM 从那段 35 秒的视频中提取了 JSON 数据(我检查了,数据是正确的)。
https://x.com/simonw/status/1846898666818490703?s=46&t=GRStLXDcUNuun8J5Noyw4Q
Swarm网页提取器:基于目标自主搜索网络,映射并提取数据
基于目标,它可自主搜索网络,映射整个网站,并提取数据。
由 OpenAI 的新多智能体框架 Swarm、@serp_api 和 @firecrawl_dev 构建
https://x.com/ericciarla/status/1847002234372215172?s=46&t=GRStLXDcUNuun8J5Noyw4Q
HeyGen互动虚拟人、让自己的AI分身接管会议、面试等
现在通过 HeyGen 的互动虚拟人,你可以做到!
查看我们在 Product Hunt 上的发布!👇
producthunt.com/posts/heygen-i…

https://x.com/bradcostanzo/status/1847024357769728486?s=46&t=GRStLXDcUNuun8J5Noyw4Q
Perplexity推出内部知识搜索:通过一个产品同时搜索组织的文件和网络内容
首次实现,您可以通过一个产品同时搜索您组织的文件和网络内容。

https://x.com/perplexity_ai/status/1846950770736091509?s=46&t=GRStLXDcUNuun8J5Noyw4Q
MotherDuck分享:把大语言模型集成SQL中
我们将大语言模型 (LLM) 集成到 SQL 中,并在 MotherDuck 数据仓库中展示小语言模型 (SLM) 的强大功能。

https://x.com/motherduck/status/1847001104569016761?s=46&t=GRStLXDcUNuun8J5Noyw4Q
产品
CodeAnt AI
CodeAnt AI 是一款人工智能代码审查工具,可以通过实时检测和修复代码质量问题、漏洞和安全隐患,显著减少代码审查时间和错误。它支持自动总结代码更改、一键修复、应用安全检测以及自定义公司政策,帮助开发团队提高效率和代码质量。
highperformr
Highperformr 是一个 AI 驱动的社交媒体协作工具,专为小团队设计,提供个性化内容创作、批量调度和多平台管理,支持无限用户协作。它还提供详细的分析和客户支持,可以提升品牌宣传效果和团队的社交媒体存在感。
https://www.highperformr.ai/
投融资
Dottxt凭借1190万美元融资,助力AI模型生成精准回答
近日,AI初创公司Dottxt宣布完成1190万美元融资,旨在推动AI模型的“结构化生成”技术。该公司由开源项目Outlines的团队创立,专注于通过改进生成模型的输出方式,帮助企业更有效地利用生成式AI技术。Dottxt的解决方案采用“模型不可知论”原则,即适用于多种大模型,并为开发者提供比现有开源工具更丰富的功能和性能。
Dottxt在2023年由Elaia领投完成320万美元的pre-seed轮融资,并在今年8月获得EQT Ventures领投的870万美元种子轮投资。公司计划利用这笔资金扩大团队规模,满足市场对结构化生成工具日益增长的需求。Dottxt的团队预计在10月底增长至17人,重点招聘开发者关系专家,以促进技术生态系统的建设。尽管商业化计划将在未来六个月启动,但当前Dottxt的主要目标是加速技术的普及应用。
Louf认为,AI模型的结构化生成将成为未来的主流,Dottxt希望借此帮助企业从生成式AI中挖掘实际价值,并在AI热潮退去之前稳步发展。
https://techcrunch.com/2024/10/17/with-11-9-million-in-funding-dottxt-tells-ai-models-how-to-answer/
— END —
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/10/21627.html