我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢 迎 大 家 一 起 交 流 !
潜空间活动报名
本期活动将在11月9日 10:00开始,我们邀请到的嘉宾是鱼哲,Lepton AI 创始成员,曾在阿里云担任高性能 AI 平台产品负责人,专注于 AI 在多个行业的落地及应用。Lepton AI 致力于建立高效可用的AI 基础设施,让团队更关注于应用构建及落地。在本次分享中鱼哲将带来关于不同AI产品形态对团队的挑战相关的思考,分享主题《Beyond Infra,What matters?—— 不同AI产品形态对团队的挑战》。除嘉宾分享外,每期设置了【匹配合伙人 Cofounder Matching】环节。你可以和 GenAI 时代最有活力的创业者和研究者线下面对面交流,将有机会找到志同道合、有共同创业梦想的小伙伴。报名通道已开启,欢迎扫描下方二维码报名。
资讯
AMD三季度财报发布,数据中心收入暴涨122%、游戏收入下降69%
AMD 发布 2024 年第三季度财报,数据中心收入增长 122%,游戏收入下降 69%。公司 2024 年第三季度营业额为 68 亿美元,略高于分析师预期的 67.0886 亿美元,同比增长 18%。这显示出 AMD 在半导体市场的竞争力不断提升,能够持续扩大业务规模并获得更多的市场份额。
毛利率为 50%,较上一年度的 47% 有所提高。按美国通用会计准则(GAAP)计算,净收入为 7.71 亿美元,同比增长 158%;稀释后每股收益为 0.47 美元,高于分析师预期的 0.46 美元,且同比增长 161%。利润的大幅增长反映出公司的运营效率和盈利能力都有了显著提升。
AMD 董事长兼首席执行官苏姿丰在新闻发布会上表示:「由于 EPYC 和 Instinct 数据中心产品的销售增长以及对 Ryzen PC 处理器的强劲需求,我们发布了强劲的第三季度财务业绩,收入创纪录。展望未来,我们在数据中心、客户端和嵌入式业务方面看到了巨大的增长机会,这得益于对更多计算的永不满足的需求。」
AMD 执行副总裁、首席财务官兼财务主管 Jean Hu 表示:「我们对于第三季度的整体执行情况感到满意。在这一阶段,我们可以清晰地看到,无论是毛利率还是每股收益,都实现了同比的强劲增长。尤其是基于数据中心和客户部门的显著增长态势,这为我们带来了极大的信心。我们有充分的理由相信,凭借着当前的良好发展势头,我们非常有希望在 2024 年实现创纪录的年收入。」
https://www.amd.com/zh-cn/newsroom/press-releases/2024-10-29-amd-reports-third-quarter-2024-financial-results.html
NVIDIA 将生成式 AI 工具、仿真和感知工作流引入 ROS 开发者生态系统
在丹麦欧登塞举行的 ROSCon 上,NVIDIA 及其合作伙伴发布了一系列更新,旨在加速 AI 驱动的机械臂和自主移动机器人的开发。主要更新包括适用于 ROS 2 的生成式 AI 工具、仿真和感知工作流,帮助开发者在 NVIDIA Jetson 边缘平台上部署生成式 AI 节点。基于生成式 AI,机器人可实现对周围环境的理解和响应,从而提升人机交互和自主决策能力。
具体技术进展包括基于 ROS 2 的 ReMEmbR 系统,将大语言模型(LLM)、视觉语言模型(VLM)等技术结合,实现语义记忆和导航;WhisperTRT ROS 2 节点优化了 OpenAI Whisper 模型,增强语音识别性能。此外,NVIDIA Isaac Sim 支持虚拟环境中的机器人测试,帮助开发者验证和优化 ROS 工作流。
NVIDIA 还发布了 Isaac ROS 3.2,增强了机器人的感知和操作能力,提升了自主移动机器人的环境适应能力。同时,NVIDIA 的合作伙伴,如优傲机器人和 Miso Robotics,正在应用 Isaac 加速器库和 AI 模型来开发协作机器人应用和自动化设备,展示了 NVIDIA Isaac 在实际场景中的应用价值。
https://zhuanlan.zhihu.com/p/4078610464
苹果3nm电脑芯片
苹果在发布会上推出新款M4系列芯片,包括M4、M4 Pro和M4 Max,这是苹果最强的3nm Mac芯片。M4 Max作为顶配芯片,内置16核神经网络引擎,适配新款16英寸MacBook Pro,支持约2000亿参数的大语言模型交互,起售价27999元。
M4 Max芯片配备16核CPU(12性能核+4能效核)和40核GPU,性能是M1 Max的2.2倍,GPU性能更是达到酷睿Ultra 7 (Series 2) 的4倍,内存带宽高达546GB/s,为AI和3D任务提供了超强计算力。此外,M4 Max还支持4台外接显示器,处理台式机级别的复杂任务更加游刃有余。
M4 Pro提供14核CPU和20核GPU,支持2台显示器,适合性价比需求的用户。基础款M4芯片则拥有10核CPU和10核GPU,适合日常办公。全系支持16GB起步统一内存,M4 Max支持最高128GB。新款MacBook Pro将于11月1日预购,11月8日正式发售。
o1推理将用于图像理解,现场演示2分钟开发应用
在伦敦的OpenAI开发者日活动中,OpenAI使用o1-mini在2分钟内实时演示了无人机控制,引发现场惊叹。OpenAI产品负责人Olivier Godement透露了o1新功能,包括功能调用、开发者消息、流媒体、结构化输出和图像理解。CEO奥特曼表示图像模型将迎来重要提升,暗示OpenAI在图像生成和分析方面的进展。清华校友路橙和宋飏参与的最新研究简化了生成质量堪比扩散模型的图像生成。
奥特曼进一步强调推理能力对未来模型的重要性,表示Agent将成为未来AI的关键,能够执行长期任务且需要少量监督,为用户减少琐事处理。在回答对竞争对手的看法时,奥特曼称赞Cursor AI,并称对AI领域的所有贡献者怀有敬意。此外,OpenAI发布了评估语言模型新基准SimpleQA,用于测试回答简短事实性问题的能力。
原梅卡曼德机器人专家高炜加入智元,担任研发部算法总监
近日,原梅卡曼德研究科学家、MIT博士高炜已离职,加入智元机器人任研发部算法总监。
此前,智元在寻觅合适的研发部算法总监人选上花了很长时间,该岗位一直空缺。高炜的加入,终于补全了智元机器人从研发到量产的技术研发人才体系。
据悉,新加入智元的高炜在机器人领域不仅有出色的学术成果,同时还有丰富的量产经验,是当前国内机器人人才市场上少有的候选人。
2017 年,高炜本科毕业于清华大学航空航天工程。
同年,高炜来到麻省理工学院(MIT)的电气工程和计算机科学系(EECS)读博,师从Russ Tedrake教授,专注于机器人学、3D视觉、运动规划与控制等方向的研究。
2021年,高炜取得计算机科学博士学位,并在年末加入梅卡曼德机器人,担任首席科学家,在梅卡曼德,高炜参与了大规模部署感知引导工业机械手的编程语言 KiloBot 等工作。
高炜曾在机器人学与计算机视觉与机器人的顶级学术会议上发表多篇文章,曾获 CVPR 最佳论文提名与 ICRA 最佳操作论文提名。
推特
00 Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式
Github Copilot大更新!集成Claude、Anthropic,加入Copilot Edits
我们很高兴与 @github 合作。通过 GitHub Copilot 集成,您将能够:
• 了解最新的库更新,例如“React 的最新更新”
• 快速找到任何问题的答案,比如“如何构建服务器端组件?”
• 访问易于理解的 API 集成支持,例如“我应该在哪里添加 Perplexity API 调用”
…所有这些功能都可直接在 GitHub Copilot 开发平台中使用。
Claude 现已在 @GitHub Copilot 上线。
从今天起,开发者可以在 Visual Studio Code 和 GitHub.com 中选择 Claude 3.5 Sonnet。未来几周内,所有 Copilot Chat 用户和组织都将逐步开放访问权限。
在 @code 中宣布 GitHub Copilot 的 Copilot Edits 🎉
快速对多文件进行大规模更改迭代,将 Copilot Chat 的对话流程和 Inline Chat 的快速反馈融合在一个体验中。
https://x.com/AnthropicAI/status/1851297754980761605 https://x.com/perplexity_ai/status/185131
https://x.com/perplexity_ai/status/1851315707411337435
Meta旧金山黑客松项目一览:恶意软件代理、Blender 的智能光标、为数据科学微调的 Llama 模型等
自动化代码生成是生成式 AI 的最大应用场景之一。
Meta 为旧金山的顶尖黑客们提供了24小时、大量奖金和海量计算资源,来探索生成式 AI 的潜力。
以下是我们在旧金山 @AIatMeta 和 @FactoryAI 的 Codegen 黑客松上看到的项目 (🧵):
恶意软件代理。由 @crewAIInc、@OpenInterpreter 和 @AgentOpsAI 构建的 AI 代理,它可以控制系统、窃取文件并更改桌面壁纸。
AI 副驾驶,用于设计 3D 网格、实体和游戏对象
代码代理,审核拉取请求并提出改进建议,使代码库更快
实时 AI 音乐生成器,根据派对的氛围自动创建曲目和转换效果
https://x.com/AlexReibman/status/1851176077080863027
ChatGPT桌面端重大更新:高级语音功能现已在 macOS 和 Windows 桌面应用中上线
ChatGPT桌面端重大更新:高级语音功能现已在 macOS 和 Windows 桌面应用中上线
https://x.com/OpenAI/status/1851714389835157660
OpenAI实时 API 更新:现在可以使用五种全新语音构建语音转语音体验;通过提示缓存来降低价格
• 现在可以使用五种全新语音构建语音转语音体验,这些语音更加富有表现力且可调控。🤣🤫🤪
• 通过提示缓存来降低价格。缓存的文本输入享有 50% 的折扣,缓存的音频输入享有 80% 的折扣。📉
https://platform.openai.com/docs/guides/realtime
https://x.com/OpenAIDevs/status/1851668229938159853
Jina AI分享Meta-Prompt:让LLM能够理解阅读器、嵌入、重排序器和分类器API
这是我们的 Meta-Prompt(元提示)。它让 LLM 能够理解我们的 Reader(阅读器)、Embeddings(嵌入)、Reranker(重排序器)和 Classifier(分类器)API,以便改进代码生成。使用元提示很简单,只需将提示复制到你喜欢的 LLM 界面中,比如 ChatGPT、Claude,或其他适合的工具,添加你的指令,就可以开始了。
在这个例子中,我们将整个提示复制到 Anthropic Claude 中,并要求它获取 Hacker News 首页的每一句话,并使用 UMAP 和 matplotlib 可视化它们。这是一个不简单的任务,因为它结合了我们的搜索框架中的多个 API,比如 Reader 和 Embedding,而 Claude 可能不了解这些。如果直接问 Claude,它可能不会给出最佳答案。但有了元提示,Claude 就能很好地理解我们的 API,并生成更优质的代码!我们可以直接将代码复制粘贴到 Google Colab 中,经过最少的修改,代码就能运行!
https://x.com/JinaAI_/status/1851651702635847729
Anthropic分享:用 Claude 3.5 Sonnet 提升 SWE-bench Verified 评分
Claude 3.5 Sonnet 通过新代理系统在 SWE-bench Verified 上达到了 49%,超越了之前 45% 的最佳记录。SWE-bench 是一种 AI 基准,测试模型在真实软件工程任务中的表现,特别是 GitHub 问题的解决能力。Claude 的成功不仅得益于模型本身,还依赖于围绕它的“代理”系统,包括提示生成、输出解析和交互循环管理。相比其他基准,SWE-bench 受欢迎的原因在于它使用真实项目任务,尚有较大提升空间,并评估完整的代理系统而非单独的模型。
https://x.com/alexalbert__/status/1851688033550242283
产品
LongTail
Langtail 是一个低代码平台,可以简化 AI 应用程序的测试,提供类似电子表格的界面,用户可以轻松创建和管理测试用例。其主要功能包括托管工具、测试配置、可分享的 AI 应用、状态助手,并且进行实时保护,帮助开发者高效迭代和优化 LLM 应用。
Bolt.New
Bolt New 是一个全栈网页应用开发平台,允许用户通过提示生成应用、实时运行、调试错误并进行部署,而无需编写代码。它提供完整的开发环境,支持 npm、Vite、Next.js 等工具,适合设计师和开发者快速原型设计和实验。Bolt New 目前免费使用,并且核心组件是开源的,用户可以在浏览器中轻松创建和管理应用。
投融资
Bifrost获800万美元A轮融资 加速3D数据生成平台发展
Bifrost是一家总部位于旧金山的3D数据生成平台公司,致力于帮助机器人和工业公司加速AI模型训练。其平台能快速生成模拟3D环境,使AI模型在数小时内适应新任务,而非数月。Bifrost最近完成由Carbide Ventures领投的800万美元A轮融资,总融资额达到1370万美元。此轮融资将用于平台的公开发布以及团队扩展,以加速产品开发。
Bifrost的主要市场在美国,并逐步拓展至日本的工业领域。该公司采用年度订阅模式,当前正与一些工业伙伴进行封闭测试。其主要客户包括机器人、航空、国防等重工业领域的AI开发人员。
https://techcrunch.com/2024/10/30/bifrost-ai-raises-8m-for-its-3d-and-ai-data-generation-platform/
Regal筹集4000万美元专注AI客服聊天机器人
Regal是一家专注于构建和定制客户服务聊天机器人的平台,旨在通过创新技术改善传统客服体验。公司由前Handy高管Alex Levin和Rebecca Greene创立,致力于为企业提供灵活的AI客服解决方案,使其能够快速响应、进行A/B测试,并个性化用户互动。Regal的机器人可进行文本和语音互动,理解客户情绪、发送后续消息或调度人工客服,以提升客户满意度。
近期,Regal完成了来自Emergence Capital、Founder Collective和Homebrew的4000万美元融资,累计融资达8300万美元。此轮资金将主要用于产品开发和扩大其位于纽约的100人团队。
公司官网:https://www.regal.ai/regalai
https://techcrunch.com/2024/10/30/regal-claims-its-customer-service-chatbots-are-better-than-most/
— END —
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/10/21653.html