大模型日报(12月4日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(12月4日 资讯篇)


资讯

01

亚马逊年末甩王炸!6款大模型、3nm AI芯片、全球最大AI计算集群


在AWS re:Invent大会上,亚马逊发布了一系列创新,展示了其在AI和云计算领域的强大实力。AWS首次亮相了自研的大模型系列Amazon Nova,涵盖了文本、图像和视频生成等多模态能力。Nova包括四个版本的语言模型(Micro、Lite、Pro、Premier),并推出了Canvas图像生成模型和Reel视频生成模型,支持从6秒到2分钟的视频创作。此外,AWS计划明年发布语音转语音模型以及任意模态转任意模态的多功能模型,进一步提升生成式AI应用的灵活性和效率。

AWS还推出了基于新一代AI训练芯片Trainium2的Amazon EC2 Trn2实例,性能相比传统GPU实例提高了30%~40%。此外,AWS发布了Trainium3芯片,采用3nm工艺,能效提高40%,并且配备史上最强AI服务器Trn2 UltraServer,支持大规模AI模型训练。AWS与Anthropic合作,构建全球最大AI计算集群Project Rainier,用以训练未来的大模型。新的AI网络结构Tnp10和低延迟PB级EFA网络的推出,进一步提升了大规模计算的速度与效率。
在生成式AI平台方面,AWS的Bedrock服务进行了重要更新,新增了自动推理检查、多Agent协作和模型蒸馏等功能,旨在帮助企业构建更高效、准确的AI应用。Bedrock的多Agent协作功能使企业能够加速任务完成,而模型蒸馏可提高模型运行速度500%、降低成本75%。
AWS还强化了开发工具的能力,推出了Amazon Q Developer平台的新功能,支持跨越代码和应用生命周期的各种开发任务,包括自动化代码审查、单元测试生成等。此外,AWS还与英伟达合作,推出基于Blackwell架构的P6实例,提供比当前GPU实例快5倍的计算速度。
在存储和数据库方面,AWS发布了S3 Tables和S3 Metadata功能,优化了大规模数据的存储与分析能力,支持更快速的数据湖分析。Amazon Aurora DSQL和DynamoDB的新功能也加强了跨区域强一致性和低延迟的数据库处理能力。
AWS还推出了支持高密度AI工作负载的全新数据中心组件,重点提升了电力、冷却效率和能源可持续性,推动了数据中心的创新与优化。这一系列的发布展示了AWS在硬件、软件和云服务方面的全面布局,进一步巩固了其在全球云计算领域的领导地位。
大模型日报(12月4日 资讯篇)
https://mp.weixin.qq.com/s/MvpVBh5fxHftsMUeRDDwag
02

股价飙涨790%!今年最火AI妖股诞生,比英伟达还猛,创始人跻身百亿富豪榜

AppLovin今年股价飙升超过790%,从年初的每股38.78美元涨至340.59美元,成为华尔街AI新宠,市值突破千亿美元大关。其成功的关键在于AI技术的应用,尤其是AI广告引擎AXON 2.0的优化,使得广告业务大幅增长。最新财报显示,AppLovin季度营收达到12亿美元,同比增长39%;净利润为4.34亿美元,同比增长300%。AI广告引擎AXON 2.0的引入,尤其是在其广告平台AppDiscovery和AI广告制作平台SparkLabs中发挥了重要作用,帮助广告主精准投放广告、优化观看效率并提升变现效果,推动了公司业绩的飞跃。
AppLovin自2023年2月推出AXON 2.0后,迅速形成了智能广告全流程解决方案,日活跃用户数达到14亿,堪比TikTok和微信。通过使用AI优化广告素材的制作和投放,AppLovin提高了广告创意的效率和质量,特别是在视频广告和交互广告方面,产生了更高的点击率和应用下载量。SparkLabs团队利用生成式AI技术,不仅能定制广告素材,还能大幅缩短制作周期并降低成本。此外,AppLovin的AI广告系统在2023年获得了显著的市场认可,带动了广告商的利润大幅增长。
作为AI和广告技术的领军企业,AppLovin的成功还体现在其管理层的财富积累上。CEO亚当·福鲁吉的个人净资产大幅增长,跻身《福布斯》亿万富翁榜单,其他高管也纷纷登榜。这与公司自成立以来的战略决策密切相关。起初,AppLovin专注于移动广告技术,后来涉足游戏开发,特别是通过收购多家游戏公司获取数据支持和提升广告投放精度,进一步推动广告技术平台的收入增长。尽管面临行业挑战,AppLovin通过持续研发和创新,尤其是AI广告引擎AXON的升级,成功应对了广告市场的变化。
AppLovin的成功案例展示了AI如何重新塑造广告营销行业,生成式AI技术不仅在广告创意和制作上提升效率,还带来了更精准的投放和更高的回报。其他企业如百度和蓝色光标也在尝试类似的AI广告转型,进一步推动了AI在广告营销中的应用。总体来看,AppLovin的AI广告技术不仅推动了其自身的快速增长,也为整个广告行业带来了新的商机和变现方式,印证了AI技术商业化的巨大潜力。
大模型日报(12月4日 资讯篇)
https://mp.weixin‍.‍qq.c‍om‍/s/DSdsY6VtasXPNdD9NxhLig
03
元资助

人工智能安全研究人类研究员计划

Anthropic Fellowship计划旨在加速AI安全研究,并支持新兴研究人才。该计划将提供资金和导师支持,面向一小批10-15名研究员,帮助他们全职参与AI安全领域的研究,周期为6个月。研究员将与Anthropic的导师合作,专注于如对抗鲁棒性、危险能力评估和可扩展监督等领域的AI安全研究
计划目的Anthropic希望通过扩大AI安全领域的研究人员池,吸引更多有志于进入该领域的技术人才。该计划特别关注中期职业技术人员的转型,但也对所有技术背景的申请者开放。
研究员的期望研究员将获得每周2100美元的津贴,并有约1万美元的研究费用支持。所有研究项目均使用公开API和开源模型。导师会为研究员提供指导,帮助他们在6个月内完成AI安全研究,并计划最终以共同第一作者身份发表研究论文。
招募要求申请者需具备强大的计算机科学或机器学习背景,精通Python,并能全职参与研究。该计划特别欢迎来自技术领域的少数群体申请,并强调技术能力和对AI安全的承诺比先前的相关经验更为重要。
如何申请计划正在接受申请,第一批研究员的申请截止日期为2025年1月20日。申请人需访问Anthropic官网提交申请。
大模型日报(12月4日 资讯篇)
https://alignment.anthropic.com/2024/anthropic-fellows-program/
04

HadaCore: Tensor Core Accelerated Hadamard Transform Kernel

HadaCore是一个优化的CUDA内核,用于执行Walsh-Hadamard变换,并通过NVIDIA的Tensor Core加速,显著提高计算性能。该内核应用于大规模深度学习模型的量化过程,特别是在推理加速中,通过压缩模型权重和采用较低精度的数据类型加速计算。HadaCore的设计优化了Fast Walsh-Hadamard算法,能够在NVIDIA A100和H100 GPU上实现1.1至1.4倍的加速,最高达到3.5倍的性能提升。

技术背景与挑战
量化技术通过减少计算精度来提升推理速度,但也可能带来精度损失。为了解决这一问题,方法如QuaRot和SpinQuant通过旋转操作减少量化误差,尤其是在INT4、INT8和FP8的量化过程中。HadaCore利用Walsh-Hadamard矩阵进行旋转,能够更高效地减少这种误差,同时避免传统矩阵乘法带来的计算开销。
Tensor Core加速的Hadamard变换
HadaCore通过NVIDIA的Tensor Core来加速Walsh-Hadamard变换。Tensor Core专门优化矩阵乘法操作,HadaCore利用16×16的Hadamard变换,对输入数据进行分块处理并实现高效并行计算。该方法通过在Tensor Core上执行特定指令,如mma.m16n8k16,能够在处理256个元素时达到更高的计算效率。
性能测试与评估
在多个基准测试中,HadaCore与Dao AI实验室的Fast Hadamard内核相比,展现了显著的性能提升,尤其是在A100和H100 GPU上。其性能提升主要体现在处理大规模数据集时的加速效果,尤其是在多头注意力机制中,HadaCore能够有效地加速Hadamard矩阵的应用。
未来发展与挑战
未来,HadaCore计划进一步优化,支持更多高级特性,如Triton版本和内核融合技术,以进一步提高性能。此外,团队还计划扩展内核支持BF16 Tensor Core计算,提升在新一代GPU上的表现。
总结
HadaCore是一个利用NVIDIA Tensor Core加速的Hadamard变换CUDA内核,通过优化计算流程,不仅提高了量化计算的速度,还有效减少了由低精度计算带来的精度损失,成为加速大规模语言模型推理的重要工具。
大模型日报(12月4日 资讯篇)

https://pytorch.org/blog/hadacore/

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

HourVideo:一个专注于小时级视频-语言理解的基准数据集

[NeurIPS D&B] 推出 HourVideo:一个专注于小时级视频-语言理解的基准数据集!🚀
包括500个第一视角视频,18个任务,共约13,000个问题!
性能表现:
GPT-4➡️25.7%
Gemini 1.5 Pro➡️37.3%
人类➡️85.0%
我们突出了多模态能力上的显著差距🧵
3D 摄像机效果,例如 浅景深 或 摇镜头变焦 (dolly zoom)。

大模型日报(12月4日 资讯篇)

https://x.com/i/status/1863652813668225040
02 

Exa Websets:朝着完美网络搜索迈出的突破性一步,从网络上找到您想要的任何内容的完整集合

推出 Exa Websets —— 朝着完美网络搜索迈出的突破性一步。

使用 Websets,从网络上找到您想要的任何内容的完整集合。
候补名单链接 – http://exa.ai/websets

大模型日报(12月4日 资讯篇)

https://x.com/ExaAILabs/status/1864013080944062567
03

Anthropic Fellows Program:旨在帮助工程师和研究人员全职转向前沿的 AI 安全研究

我们正在启动一项研究员计划,旨在帮助工程师和研究人员全职转向前沿的 AI 安全研究。
该计划将于 2025 年 3 月启动,我们将为 10-15 名具备优秀编程和技术背景的研究员提供资金支持、计算资源和研究指导。
大模型日报(12月4日 资讯篇)
https://x.com/AnthropicAI/status/1863648517551513605
04

Nous Research 宣布成功使用 Nous DisTrO 和互联网进行 150 亿参数语言模型的预训练

Nous Research 宣布成功使用 Nous DisTrO 和互联网进行 150 亿参数语言模型的预训练,此次训练得到了以下合作伙伴提供的异构硬件支持:
@Oracle、
@LambdaAPI、
@NorthernDataGrp、
@CrusoeCloud 以及 Andromeda 集群。
此次训练展示了与集中化训练相媲美甚至超越的损失曲线和收敛速度。
我们关于 DeMo(推动 Nous DisTrO 开发的基础研究)的论文和代码现已公开(链接如下)。
大模型日报(12月4日 资讯篇)
https://x.com/NousResearch/status/1863622813317464157
05

Cohere推出Rerank 3.5:最新的 AI 搜索模型

推出我们最新的 AI 搜索模型:Rerank 3.5!
Rerank 3.5 提供了业界最先进的性能,具备更强的推理能力和多语言支持,能够精准搜索复杂的企业数据,如长文档、电子邮件、表格和代码。
大模型日报(12月4日 资讯篇)
https://x.com/cohere/status/1863586939288367386

产品

01

Stackfix——一款可以同时比较多款SaaS软件的比较平台

Stackfix 是一个创新的软件比较平台,它能让用户在几秒钟内完成软件的对比和选择。该平台的独特之处在于提供了一个自由、无打扰的环境,用户可以快速查看和比较不同软件的价格与功能,获取实时报价和专业建议,而无需应对烦人的推销电话和无休止的评论。
大模型日报(12月4日 资讯篇)
https://www.stackfix.com
02

Supabase 人工智能助手——数据库的想法

Supabase 集成了多项强大功能,为开发者和企业提供无缝的数据库管理和分析支持。这个助手能够帮助用户快速设计 Postgres 数据库模式,无需手动编写复杂的 SQL 语句;轻松执行数据查询并生成直观的图表,让数据分析更加高效。此外,它还支持 错误调试 功能,能够快速定位和解决代码问题,大幅提升开发效率。
针对高级数据库管理需求,助手提供 Postgres 行级安全(RLS)策略 的自动生成与管理,确保数据访问的精细化控制;还支持创建 Postgres 函数 和 触发器,实现更灵活的业务逻辑与事件驱动操作。此外,它可以将 SQL 语句直接转换为 Supabase-js 代码,为开发者在前端与数据库的集成提供极大的便利。

大模型日报(12月4日 资讯篇)

https://supabase.com/assistant

投融资

01

前微软员工获得400万美元融资,打造产品演示AI工具

Lica是一款由两位前微软员工创办的AI工具,旨在简化产品视频和教程的制作过程。该工具能够自动将屏幕录制和截图转化为高质量的视频,省去了传统视频制作中时间和成本的消耗。Lica的创始人Priyaa Kalyanaraman和Purvanshi Mehta曾在微软担任产品经理和数据科学家,他们意识到许多企业在创建视频时面临的效率问题。
Lica刚刚完成了400万美元的种子轮融资,融资由Accel领投,South Park Commons、Village Global以及多位天使投资人参与,包括Replit的CEO Amjad Masad、前a16z合伙人Balaji Srinivasan和Replit的总裁Michele Catasta等。Accel的Sameer Gandhi认为,Lica凭借其强大的AI功能和直观的设计,在视频创作市场中具有独特的竞争优势。
Lica的核心功能包括自动化生成产品视频、添加转场效果、背景音乐和配音,同时用户可以通过AI助手进行进一步的定制,例如根据目标受众调整语气或视频风格。该工具特别适用于产品、客户成功团队和销售团队,帮助他们高效地制作演示视频或教程。
目前,Lica提供免费版本,允许用户每月创建10个不超过3分钟的视频。付费版定价49美元/月,提供无限制的视频制作和更多定制选项。未来,Lica计划扩展其功能,支持更多类型的视频制作,如营销视频、社交媒体内容和投资者演讲等。
通过结合先进的AI技术和直观的设计,Lica希望能够为广大企业用户提供更便捷、高效的产品展示和沟通工具,填补视频制作领域的空白。
公司官网:https://www.lica.world/

大模型日报(12月4日 资讯篇)

https://techcrunch.com/2024/12/03/ex-microsoft-employees-get-4m-from-accel-to-build-an-ai-tool-for-product-presentations/



推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/24278.html

Like (0)
Previous 2024-12-04 17:56
Next 2024-12-05 15:38

相关推荐