大模型日报(1月18-19日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(1月18-19日 资讯篇)

资讯

01

扩散模型也能推理时Scaling,谢赛宁团队新研究

近期,纽约大学谢赛宁团队对扩散模型在推理时的计算量扩展(scaling)进行了探索。研究表明,增加推理时的计算量可以显著提升扩散模型生成的样本质量,特别是在图像生成任务中。这项研究不仅关注传统的增加去噪步骤的方法,还探讨了如何在推理过程中通过搜索策略来有效利用计算资源,进而提升扩散模型的性能。
扩散模型生成过程需要多次前向传递去噪,去噪步骤的数量通常决定了计算成本与生成质量之间的平衡。以往的研究倾向于减少去噪步骤以提高效率,但本研究则提出,除去噪外,可以通过更有效地搜索“更好的噪声”来优化生成效果,从而实现推理时计算量的扩展。具体而言,研究团队设计了一个搜索框架,利用验证器对生成样本进行评分,并根据反馈调整采样噪声,探索如何在多个噪声候选中选择最优样本。
研究采用了不同的搜索算法,如随机搜索、零阶搜索和路径搜索,结合不同的验证器(如CLIP、DINO等)进行实验。在ImageNet等数据集上,结果表明,通过搜索优化噪声的方式,推理时计算的扩展不仅提高了样本质量,还能在不同生成任务中根据需求调整验证器的设置。
此外,研究还显示,验证器与任务的匹配程度对生成效果有显著影响,某些验证器在特定任务中表现更好。同时,搜索方法与微调技术是兼容的,二者结合可进一步提高生成模型的表现,尤其是在文本到图像的生成任务中。该研究的成果为扩散模型的推理优化提供了新的思路,通过有效的搜索策略来突破传统方法的限制,从而提升生成质量与计算效率。
大模型日报(1月18-19日 资讯篇)


htt‍ps://mp.weixin.qq.com/s/uQxHkPeLQkiZ0y8NEF5bmg
02

又一位OpenAI高管离职

据《连线》杂志报道,OpenAI前首席技术官Mira Murati创办的神秘AGI创企从OpenAI、Character AI和谷歌DeepMind等竞争对手挖走了约10名员工,其中最重要的或许是OpenAI原特别项目负责人Jonathan Lachman。Lachman有着复杂的背景,曾在普林斯顿大学和哈佛大学肯尼迪政治学院求学,并在美国国防部、美国国家管理和预算局等多个重要政府部门工作,负责管理超过万亿美元的国防预算。在特朗普政府上台后,Lachman离开华盛顿,转投硅谷,加入VR公司Leap Motion,并与Murati建立了职场关系。此后,他又加入金融科技创企Blend,成功帮助公司实现上市。
Lachman在OpenAI担任特别项目负责人期间,负责多个战略合作和特殊项目。OpenAI逐步放松了关于军事使用AI技术的规定,允许其技术应用于战场。他在LinkedIn上对自己的工作内容描述模糊,但可以推测,他在推动AI技术的军事化方面起到了关键作用。Lachman的离职对OpenAI而言是一次重要损失,因为他是连接政界、军界和科技界的桥梁。而对Murati的创企来说,Lachman的加入可能预示着其公司方向的重大转变。
Murati的创企虽然仍处于早期阶段,但Lachman的加盟或许将为其带来新的动向和发展机会。
大模型日报(1月18-19日 资讯篇)
https://mp‍.weixin.q‍q.com/s/JxRmIlPyMlM-ym0q1dLYxQ
03
元资助

2025 AAAI Fellow公布:港科大(广州)熊辉、华盛顿大学陈一昕等四位华人入选

AAAI(人工智能促进协会)是全球人工智能领域的重要学术组织,其Fellow是该组织的最高荣誉,授予对人工智能做出杰出贡献的学者,每年入选人数严格限制。2025年度,16位AI学者荣膺AAAI Fellow,其中包括4位华人学者。
陈一昕是华盛顿大学计算机科学与工程系的教授,以机器学习、数据挖掘和人工智能领域的贡献获得认可,尤其是他在图神经网络架构和轻量级深度神经网络算法方面的创新。他曾获得IEEE Fellow等荣誉。
付昀是美国东北大学的教授,在计算机视觉和增强人机交互领域做出了革命性贡献,特别是在AI技术商业化方面的成就。付昀还多次创业,将AI技术应用于多个行业,获得众多行业奖项。
熊辉是香港科技大学(广州)的教授,长期从事数据挖掘和人工智能领域的研究,开发了广泛使用的Informer算法,曾在多个顶级期刊和会议上发表论文。他曾任罗格斯大学终身教授,并获得IEEE Fellow、AAAS Fellow等荣誉。
杨明玄是加州大学教授,研究方向包括计算机视觉、模式识别和机器人学,提出了广泛使用的视觉跟踪算法评测基准数据集,并在国际会议中担任多个重要职务。
此外,还有多位AI领域的重要人物入选Fellow,包括机器学习、强化学习、自然语言处理等多个方向的专家,他们在AI技术的发展和应用方面做出了重要贡献。
    https:/‍/mp.weixin.qq.com/s/pZfpgWDyhfJidhW9WcQd6A

    推特

    01
    00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格
    OpenAI分享示例:用于使用实时 API 构建和协调代理模式,不到 20 分钟内原型化语音应用

    我们提供了一个示例,用于使用实时 API 构建和协调代理模式。您可以使用这个仓库在不到 20 分钟内原型化一个基于多代理流程的语音应用!
    使用实时 API 构建应用可能会很复杂,因为语音交互具有低延迟和同步的特性。这个仓库包含了我们在应对这些复杂性时总结的最佳实践,例如:
    • 协调代理切换(借鉴了 Swarm 的理念)
    • 在后台升级到 o1 以进行高级决策
    • 通过在提示中定义状态机来提升模型的指令执行能力
    • 展示将这些模式应用于客户服务和前台接待场景的演示案例
    大模型日报(1月18-19日 资讯篇)
    https://x.com/OpenAIDevs/status/1880306077738365211
    02 

    Daniel San分享:在 Cursor 中引入代码库知识图谱


    在 Cursor 中引入代码库知识图谱 🤩
    在这段视频中,我将带你了解我们如何从 CodeGPT 平台上的知识图谱,逐步实现将其直接应用于 @cursor_ai 编辑器中的过程。
    这个工具专为处理庞大的代码库而设计,可以快速导航、识别节点和关系,并为专注于代码开发的模型(如 @AnthropicAI 的 Claude 3.5 Sonnet)提供更丰富的上下文支持。
    敬请期待即将推出的教程,我会手把手教你如何创建知识图谱,并将它们无缝集成到整个软件开发工作流中,从提交记录(Commits)、拉取请求(Pull Requests)到甚至 Trello 工单!

    大模型日报(1月18-19日 资讯篇)

    https://x.com/dani_avila7/status/1880739290264809683

     投融资

    01
    00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

    Perplexity收购职业社交平台Read.cv,进一步扩展企业功能


    AI驱动的搜索引擎Perplexity近日宣布收购了职业社交平台Read.cv,这一平台曾与LinkedIn竞争。根据收购协议,Read.cv将于本周五开始停运,用户可在5月16日前导出个人资料、帖子和消息等数据。Read.cv在其博客中表示,收购后,团队将加入Perplexity,继续致力于“探索与发现”的共同使命。
    Read.cv成立于2021年,由曾在Facebook、Mozilla和Salesforce旗下的Quip担任产品设计师的Andy Chung创办。平台提供多种工具,帮助用户展示简历、与行业内其他专业人士互动,并为组织提供团队简介、招聘信息发布和候选人搜索等功能。近期,Read.cv还推出了“Sites”功能,允许用户利用Read.cv个人资料发布个人网站,并获得“.cv”域名。收购后,Read.cv计划将这些“.cv”域名迁移至其合作伙伴Hello.cv,用户将可以继续管理这些域名。
    Perplexity目前未透露收购后Read.cv的具体计划,但可以预见,Perplexity将进一步增强其面向企业的功能。Perplexity在去年夏天推出了企业版,增加了用户管理、内部知识搜索等功能。这一收购可能是Perplexity回应其风险投资者的需求,投资者希望尽早看到回报。
    Perplexity在此之前已经完成了两项收购,包括专注于将AI系统与外部数据源连接的Carbon,以及开发Perplexity移动应用的Spellwise。Perplexity至今已筹集超过5亿美元资金,主要投资方包括Institutional Venture Partners,估值达到90亿美元。此次收购是Perplexity扩大企业功能的一部分,预计将在企业市场中获得更大的份额。
    https://linktr.ee/readcv
    大模型日报(1月18-19日 资讯篇)
    https://techcrunch.com/2025/01/17/perplexity-acquires-read-cv-a-social-media-platform-for-professionals/


    推荐阅读

    — END —

    1.   The theory of LLMs|朱泽园ICML演讲整理

    2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

    3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


    原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/33460.html

    Like (0)
    Previous 2025-01-17 21:05
    Next 2025-01-20 08:49

    相关推荐