大模型日报(12月20日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(12月20日 资讯篇)

行云季宇:谁困住了 AI 产业——大型机化的计算机形态与变革的可能性 | 奇绩潜空间活动报名

【奇绩潜空间】是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,潜空间定期邀请大模型前沿创业者分享产品实践探索,邀请前沿科研学者分享最新技术进展。

第五季第二期潜空间邀请到的嘉宾是行云创始人兼 CEO ——季宇,在本次活动中季宇将在北京现场与大家面对面交流,他分享的主题是《谁困住了 AI 产业——大型机化的计算机形态与变革的可能性》。

大模型日报(12月20日 资讯篇)

资讯

01

谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview


OpenAI的12天连续发布即将结束,但谷歌的Gemini 2.0系列显然吸引了更多关注。特别是Gemini 2.0 Flash Thinking,它在推理和速度方面表现出色,成为了当前AI聊天模型的领跑者。这个模型基于Gemini 2.0 Flash,并通过专门的训练增强了推理能力,能够显式展示思考过程。根据Jeff Dean的展示,模型在解答物理问题时展示了详细的推理步骤,且耗时较短。
虽然Gemini 2.0 Flash并非最终版本,但Flash Thinking已经在多个领域的评测中领先,包括编程、数学和创意写作等。根据Alex Volkov的测试,Flash Thinking在推理速度上比其他模型快了两倍,而其表现也优于OpenAI的o1系列。网友对这个模型的推崇不已,认为它将成为ChatGPT和Claude等竞争对手的有力挑战者。
Gemini 2.0 Flash Thinking在数学推理上尤其突出,快速且准确。例如,它在14秒内解答了一个复杂的数学题,比其他模型快五倍;而在解答数学期望问题时,速度是OpenAI o1模型的两倍。尽管如此,模型也有犯错的时候,如在识别单词“strawberry”中字母“r”的数量时出现了错误。它还未能解决一些简单的数值比较问题,但在某些复杂推理任务上却表现出色,比如首次成功解决了三赌徒问题。
除了数学推理,Gemini 2.0 Flash Thinking还在编程和跨模态任务中表现优秀。例如,它能够编写一个功能完整的井字棋游戏,并且能够处理古代数学题“孙子算经”。此外,模型支持多模态输入,如图片和音频,能够解答梗图或手写数学问题,尽管在一些任务如验证码识别上失败了。
大模型日报(12月20日 资讯篇)
https://‍mp.weixin.qq.co‍m/s/b0yqPre6wMlP59cH6Qrbdw
02

普渡机器人解答具身智能商业化的终极命题

普渡机器人在12月19日发布了其首款全尺寸双足人形机器人PUDU D9,并计划开始预售。这款机器人由普渡X实验室研发,集成了普渡在移动、操作和AI技术方面的核心能力,旨在解决服务机器人在多场景中的应用难题。PUDU D9的双足行走速度可
达2米/秒,能够适应楼梯、斜坡等复杂地形,利用视觉语义导航技术实时构建3D语义地图,实现自主规划路线和动态避障。其配备的两条7自由度机械臂及11自由度灵巧手可进行精细操作,支持端到端任务规划和执行。
普渡的发布标志着其在类人形和人形机器人领域的全面布局,成为行业内首家实现三种机器人形态(专用、类人形、人形)全覆盖的厂商。通过多技术栈的驱动,普渡解决了服务机器人跨场景应用的泛化性问题,推动了具身智能的商业化进程。张涛,普渡创始人兼CEO,强调通过“开发一代、储备一代、预研一代”的开发模式,提前介入技术成熟与市场准备之间的平衡。
普渡从2017年起便开始了机器人研发,逐步积累了足式和机械臂技术。在餐饮、酒店等行业中,普渡通过提升机器人操作能力,解决了跨场景任务的泛化难题,如机器人能完成上菜回盘、按电梯等复杂操作,避免了传统机器人需改造物理环境的高昂成本。普渡认为,具身智能的商业化必须依赖于多技术栈的并行发展,尤其是操作能力的提升。
此外,普渡在全球化商业化方面也具备显著优势。其已在全球建立了700多个代理商,产品行销超过60个国家,海外营收占比高达80%。通过强大的供应链管理和全球化渠道网络,普渡在机器人行业的市场份额稳居全球第一,并为其后续人形机器人产品的推广提供了成熟的渠道体系和客户资源。
大模型日报(12月20日 资讯篇)https://mp.weixin.qq.‍com/s/T_NAbrPVT6B0p0jbSLpP_g
03
元资助

AWS的大模型布局

Amazon近期推出了一系列重磅技术和服务,特别是在大模型和AI领域的创新,震撼业内。首先,Amazon自研的基础模型Amazon Nova在各类基准测试中表现出色,超越了GPT、Gemini、Claude等同级别模型,展示了其强大的性能。Nova包括多个版本,从适用于简单任务的Micro模型,到高性能的Premier多模态模型,支持微调和蒸馏训练,为大规模推理任务提供强大支持。
此外,Amazon还发布了全新的Trainium 3芯片,该芯片基于3nm工艺,性能是前代Trainium 2的两倍,能效提升40%,预计将于2025年正式发布。同时,亚马逊还推出了EC2 Trn2实例,性价比提升30%-40%,以及通过NeuronLink互联的超算集群UltraServer,提供20.8 PFLOPS算力,支持大模型的高效训练。
在数据层面,Amazon对其S3存储进行了重要更新,包括推出S3 Tables和S3 Metadata元数据服务,提升了存储和查询效率,特别适用于大模型的海量数据需求。此外,Amazon强化了其网络架构,推出了“10p10u”网络,支持超大规模的AI集群互联,提供更高带宽和更低延迟。
Amazon SageMaker也迎来了重大升级,统一了数据、分析和AI工作流,支持Zero-ETL能力,简化了数据处理和模型训练过程。新版本的SageMaker通过Iceberg兼容的数据湖服务,使得大规模数据集成和访问更加高效,为大模型提供了稳定的数据“饲料”。
在模型服务方面,Amazon继续扩展Bedrock平台,提供超过100个业界领先的大模型,支持客户根据需求选择和定制模型。新推出的模型蒸馏功能使得客户可以在不损失性能的情况下,优化模型体积,提高推理效率。
在应用层,Amazon推出了AI助手Amazon Q,分别面向开发和商业场景。Amazon Q Developer帮助开发者自动化繁琐的迁移和维护任务,并与GitLab深度集成,提升开发效率。Q Business则面向企业,提供强大的跨数据源搜索和自动化任务功能,增强企业的业务智能能力。
大模型日报(12月20日 资讯篇)
https://mp.weix‍in.qq.com/s/0CMoSyiTAkHuxpJhPFeQIQ
04
元资助

OpenAI元老级研究员Alec Radford离职

Alec Radford,OpenAI 的一位关键人物,决定离开公司,开展独立研究,尽管他计划继续与 OpenAI 以及其他 AI 开发者合作。Radford 在 GPT-1 和 GPT-2 的创建中发挥了至关重要的作用,他的贡献对预训练模型的发展起到了基础性作用。特别是在引入半监督学习以及 GPT-2 的创新方面,他为 AI 领域带来了重大突破。
Radford 的离职引发了关于 OpenAI 未来的猜测,一些人认为这可能预示着 GPT-4.5 的发布。尽管他长期处于幕后,但他的工作深刻影响了 OpenAI 的发展,尤其是 GPT-3 和 GPT-4 的研究。Radford 被广泛认为是现代生成式 AI 的奠基人之一。尽管他较少出现在公众视野中,但他的研究成果已成为该领域的里程碑,并且得到了广泛引用,显示出其持续的影响力。
OpenAI 的领导层对 Radford 的离开表示尊重,认为他在公司的成功中扮演了重要角色。虽然他的离职对 OpenAI 来说是一个损失,但人们也期待他在独立研究中能继续推动 AI 领域的发展。
大模型日报(12月20日 资讯篇)
https://mp.w‍eixin.qq.com/s/ore0_DywmwGunMq1rYRJmQ
05
元资助

「阿里香港创业者基金」推出1.5亿美元聚焦AI的「NextGen基金」

12月17日,阿里巴巴香港创业者基金(AEF)宣布推出第三只聚焦人工智能(AI)驱动初创公司的基金——AEF NextGen 基金,规模为1.5亿美元(约11亿元人民币)。该基金将由AEF的专业团队“NextGen Partners”管理,投资于那些已证明市场潜力、致力于利用AI技术解决结构性问题的成长期公司,重点领域包括金融服务、消费零售、医疗健康、建筑地产及艺术娱乐等。此外,AEF NextGen 基金还将为这些公司提供全球扩张所需的资源和专业支持。
AEF成立于2015年,是阿里巴巴集团发起的非营利计划,旨在支持香港及大湾区的创业生态系统。AEF通过香港基金、大湾区基金和NextGen基金为创业公司提供投资,并借助阿里巴巴生态系统提供战略支持,帮助他们拓展中国大陆及全球市场。自成立以来,AEF已投资超过80家初创公司,资金总额超过1亿美元,并带动超过28亿美元的共同投资。未来,AEF将继续推动新技术的应用,特别是在AI领域,支持那些有潜力塑造未来技术的公司。
在同一天,阿里巴巴还宣布将出售银泰100%的股权,预计交易所得约为74亿元人民币(约10亿美元),但也预计将因出售录得约93亿元人民币的亏损。此次出售符合阿里巴巴“聚焦核心业务”的战略,作为调整非核心资产的一部分。去年,阿里巴巴就已决定将“AI驱动”作为战略重心,并计划在2024财年完成多项非核心资产的出售,累计金额达到17亿美元。https://mp.weixin.qq‍.com/s/UL75lq4HtnY79tzZtBRv9gg

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Deeplearning AI分享《Reasoning with o1》:如何高效使用o1模型

OpenAI 昨天刚刚宣布了对 o1(高级推理模型) 的 API 访问权限。今天,我很高兴宣布推出一门全新短期课程 《Reasoning with o1》,该课程由 @OpenAI 共同开发,并由 OpenAI 的 AI 解决方案负责人 @colintjarvis 授课,旨在教你如何高效使用这个模型!
与之前直接生成输出的语言模型不同,o1 会“在回答前思考”,先生成多个推理标记(reasoning tokens),然后再返回更深思熟虑且准确的回答。它在复杂推理方面表现卓越,包括代理工作流的规划、代码编写,以及法律等 STEM 领域的专业推理。但使用它的方式与其他 LLM 非常不同。
我认为 o1 将会为许多 AI 应用带来革命性变化。在这门课程中,你将学习如何高效使用它。
课程内容:
• 学习识别 o1 适合的任务,以及何时使用较小模型,或将 o1 与较小模型结合使用
• 理解推理模型的新提示原则:简单直接;无需明确的“思维链”;使用结构化方法;“展示”而非“说明”
• 实现多步协调流程:由 o1 负责规划,将具体步骤交给 gpt-4o-mini 执行。这种设计模式能优化智能(准确性)与成本
• 使用 o1 进行代码任务:构建新应用、编辑现有代码,并通过在 o1-mini 和 GPT-4o 间举办编程竞赛来测试性能
• 使用 o1 进行图像理解:学习其通过“推理层级”(hierarchy of reasoning)表现更优。o1 在前期耗费时间和成本对图像进行预处理和丰富细节索引,从而提高后续问答环节的效率
• 学习一种名为 meta-prompting 的技术:使用 o1 改进提示。通过客户支持评估集,迭代利用 o1 修改提示以提高性能
此外,你还将了解 OpenAI 如何通过强化学习训练出一个能在“测试时计算”(test-time compute)以提升性能的模型。
我相信你会发现这门课程既有趣又有价值。
点击此处报名:https://deeplearning.ai/short-courses/reasoning-with-o1/

大模型日报(12月20日 资讯篇)

https://x.com/AndrewYNg/status/1869421643925422166
02 

Pika2.0:到12月22日之前为所有人提供免费、无限制提供访问权限

来自 Pika 团队的节日前超大礼物:我们为所有人提供免费、无限制的 Pika 2.0 访问权限!
从今天起到 12 月 22 日,任何用户,无论使用哪个计划,都可以生成任意数量的视频,并使用所有的场景素材。
这是为期 4 天的全面免费活动,所以趁着外面冷赶快来体验吧!访问网址:pika.art

大模型日报(12月20日 资讯篇)

https://x.com/pika_labs/status/1869885228581323110
03

Elevenlabs 分享Flash:在 75 毫秒内生成语音

认识 Flash,我们最新的模型,可以在 75 毫秒内生成语音(加上应用和网络延迟)。
你从未体验过如此快速且接近人类的文本转语音技术!

大模型日报(12月20日 资讯篇)

https://x.com/elevenlabsio/status/1869462840941461941
04

ChatGPT 现在可以通过语音或文本直接在 macOS 上与更多的编程和笔记应用协作

ChatGPT 现在可以通过语音或文本直接在 macOS 上与更多的编程和笔记应用协作。
通过对 Warp、IntelliJ IDEA、PyCharm 等编程应用的扩展支持,让你可以在上下文中处理代码。
现在你可以使用 o1 和 o1 专业模式的强大功能进行编程。
我们还新增了对 Apple Notes、Notion 和 Quip 等笔记应用的支持。
同时,你可以在使用这些应用时启用高级语音功能。

大模型日报(12月20日 资讯篇)

https://x.com/OpenAI/status/1869837577337049434

产品

01

Trickle 轻松构建令人惊叹的 AI 应用程序、网站和表单

Trickle 是一款功能全面的全栈式开发平台,为个人和团队提供了一个从创意到产品的快速实现路径。无论是 AI 代理、Web 应用,还是交互表单,Trickle 都能帮助用户轻松构建、启动并高效管理这些解决方案。借助其内置的数据库支持、AI 模型集成、实时数据分析以及强大的设计工具,用户可以在一个统一的环境中完成开发、测试和部署工作。Trickle 的直观界面和模块化功能使其既适合技术新手,也能满足专业开发者的高效需求,让创意从概念迅速转化为可立即使用的应用,助力每个用户实现自己的技术创新梦想。
大模型日报(12月20日 资讯篇)
https://www.trickle.so
02

GenFuse人工智能 使用 AI 代理自动完成任何工作。无需任何技术技能

GenFuse AI 是一款革命性的无代码平台,专为简化 AI 代理自动化而设计。无论用户是否具备技术背景,都可以利用 GenFuse AI 的直观工具轻松创建多代理工作流,将繁琐的重复任务自动化处理。通过减少人工操作,用户能够显著提升效率,而无需增加团队规模。GenFuse AI 提供了灵活的配置选项和强大的自动化功能,使个人和企业都能快速构建和部署智能工作流,从而专注于更具价值的战略性工作,释放团队的潜力,实现更高效的运营模式。
大模型日报(12月20日 资讯篇)https://genfuseai.com

投融资

01

Perplexity完成5亿美元融资,估值达90亿美元

AI驱动的搜索引擎Perplexity最近成功完成了一轮5亿美元的融资,融资后公司的估值跃升至90亿美元。这一轮融资由Institutional Venture Partners主导,并于12月初完成。据报道,这笔巨额融资是在AI搜索领域竞争愈加激烈的背景下进行的。近期,OpenAI推出了ChatGPT搜索,与Perplexity展开竞争,同时Google也在开发与Perplexity相媲美的功能,包括搜索结果页面上的AI生成摘要和回答。尽管面临来自大企业的竞争,Perplexity并未停滞不前,近日还完成了首笔收购,收购了专注于连接AI系统与外部数据源的初创公司Carbon。此外,Perplexity还正在应对一起关于版权侵权的集体诉讼。
大模型日报(12月20日 资讯篇)
https://techcrunch.com/2024/12/19/perplexity-has-reportedly-closed-a-500m-funding-round/
02

Cursor获1亿美元融资,估值飙升至25亿美元,Thrive领投

Anysphere公司,AI编程助手Cursor的开发者,近日完成了1亿美元的B轮融资,融资后估值为25亿美元。这一轮融资由现有投资者Thrive Capital领投,Andreessen Horowitz(a16z)也参与其中,但并未联合领投。值得注意的是,这笔融资发生在短短四个月内,公司估值从400百万美元跃升至25亿美元,增长幅度惊人。
此前,Anysphere公司在2024年8月完成了60百万美元的A轮融资,并由Thrive Capital和Andreessen Horowitz支持。此次融资不仅进一步印证了投资者对公司前景的高度认可,还显示出其AI编程助手Cursor在市场上的快速增长。
Cursor的收入表现尤为突出:2024年4月时,公司的年化经常性收入(ARR)为400万美元;到10月,这一数字已达到每月400万美元,相当于年化收入达4800万美元,显示出公司强劲的增长势头。值得一提的是,Cursor的用户包括OpenAI、Midjourney、Perplexity、Shopify等知名公司。
Cursor采用的是“免费增值”模式,用户可在两周的免费试用后,选择订阅20美元/月的个人版或40美元/月的企业版。企业用户的规模和需求进一步推动了公司的收入增长。Cursor正在与包括微软GitHub Copilot在内的其他AI编程助手竞争。
Anysphere的创始团队由四位MIT学生于2022年共同成立,之前公司曾参加OpenAI的加速器项目,并获得OpenAI Startup Fund的种子投资。除了Thrive Capital,其他投资者还包括Neo风投、Stripe联合创始人Patrick Collison、前GitHub CEO Nat Friedman等。
大模型日报(12月20日 资讯篇)
https://techcrunch.com/2024/12/19/in-just-4-months-ai-coding-assistant-cursor-raised-another-100m-at-a-2-5b-valuation-led-by-thrive-sources-say/
03

BlueQubit获得1000万美元融资,推动量子软件在实际应用中的落地

BlueQubit是一家总部位于旧金山的量子软件初创公司,成立于斯坦福大学的校友团队。公司专注于通过其“量子软件即服务”(QSaaS)平台,解决量子计算与现实世界应用结合的难题。BlueQubit通过为用户提供量子处理单元(QPU)和量子计算模拟器,旨在将量子计算技术引入金融、制药和材料科学等领域。
2024年12月,BlueQubit宣布完成由Nyca Partners领投的1000万美元种子轮融资。公司希望通过将企业应用与先进的量子硬件结合,推动量子计算技术的商业化。随着金融、制药和材料科学等行业面临经典计算的极限,量子计算的前景愈加受到关注。
BlueQubit的QSaaS平台支持包括金融建模、制药开发和可视化等应用。公司利用大规模经典计算资源,特别是GPU集群,在实际量子处理器部署前开发和测试量子算法,从而推动量子机器学习和量子优化算法的创新。此外,BlueQubit的量子模拟器运行速度是常见替代品的100倍,并结合自研算法,进一步提升了量子计算的效率。
BlueQubit的创始人之一Hrant Gharibyan曾与Google量子AI团队合作,共同开发了革命性的“虫洞传输”算法。Gharibyan与CTO Hayk Tepanyan在斯坦福大学相识,并于2022年春天在加利福尼亚州圣塔莫尼卡的一次冲浪活动中决定创办BlueQubit。通过此次融资,BlueQubit计划加速量子技术的应用,特别是为金融服务行业提供量子计算的实际解决方案。
公司官网:https://www.bluequbit.io/
大模型日报(12月20日 资讯篇)
https://techcrunch.com/2024/12/19/bluequbit-raises-10m-to-take-quantum-software-into-real-world-applications/
04

Decart获得3200万美元融资,估值突破5亿美元,打造AI技术和“开放世界”应用

Decart是一家迅速崭露头角的初创公司,成立不到两个月便吸引了大量投资者的关注。该公司目前正在开发一项完全垂直整合的AI研究实验室,并基于此推出面向企业和消费者的产品。其首个企业级产品用于优化GPU使用,已为公司带来数百万美元的收入。而其首个面向消费者的产品则是一个名为“Oasis”的可玩“开放世界”AI模型,在发布后吸引了数百万玩家。
在强劲的市场反应下,Decart于2024年12月完成了3200万美元的A轮融资,Benchmark领投,Sequoia和Zeev Ventures也参与其中。这一轮融资将帮助公司加速其技术的商业化。融资完成后,Decart的估值已突破5亿美元,而在种子轮时,估值仅为1亿多美元。
Decart的CEO兼联合创始人Dean Leitersdorf表示,公司的目标不仅仅是挑战OpenAI、Anthropic等大公司,而是要创建一家万亿级的企业。他还透露,虽然公司已有多次收购接洽,但他们更专注于自我发展。Leitersdorf背景十分卓越,曾在以色列的Technion大学完成本科、硕士和博士学位,期间还兼顾了军役。
Decart目前主要专注于三大领域:系统(基础设施优化)、模型(AI算法)和数据(应用程序)。其首个产品是一款优化GPU使用的系统软件,已经被多家公司采用,大大降低了人工智能模型运行的成本。Leitersdorf表示,使用Decart软件后,原本每小时100美元的工作负载可以降至仅25美分每小时,这一成果让市场对公司产生了浓厚兴趣。
此外,Decart还推出了Oasis这款“开放世界”游戏,通过生成AI来提供实时、响应式的音频和视觉互动。未来,公司计划推出更多类似的体验,涵盖增强现实(AR)和虚拟现实(VR),并且这些体验无需特定硬件即可运行。
随着AI技术的广泛应用,Decart通过优化AI生成效率并降低门槛,帮助推动了创造力和实用应用的新一波浪潮。这一进展引起了风险资本的强烈兴趣,也为公司未来的发展奠定了坚实的基础。
公司官网:https://www.decart.ai/
大模型日报(12月20日 资讯篇)
https://techcrunch.com/2024/12/19/decart-adds-another-32m-at-a-500m-valuation/



推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/29011.html

Like (0)
Previous 2024-12-19 21:50
Next 2024-12-21 18:25

相关推荐