大模型日报(9月29日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(9月29日 资讯篇)

资讯

01
特斯联递表港交所,商汤、京东、科大讯飞等参投,年营收超10亿元

重庆特斯联智慧科技股份有限公司于9月26日向港交所主板提交上市申请,中信证券与海通国际担任联席保荐人。如果成功上市,特斯联将成为中国AIoT领域的首家上市公司。
特斯联成立于2015年,是中国AIoT(人工智能与物联网融合)行业的先行者,致力于推动产业数智化升级和可持续发展。公司主要聚焦楼宇、社区、园区、城市和双碳五大核心场景,通过AIoT技术实现智能化管理和产业生态发展。
根据招股书,2023年特斯联收入为10.06亿元,同比增长36.3%,其中62%的收入来自于产业数智化业务。特斯联的AIoT操作系统TacOS是亚洲首个支持公域空间全场景应用的AIoT操作系统,已在全球150个城市部署,服务800多个客户,并在手订单金额约20亿元。
特斯联的创始人艾渝拥有丰富的新经济项目投资经验,曾投资美团、蔚来等知名企业。此外,特斯联的产研团队由三位IEEE Fellow(国际电气与电子工程师协会会士)领衔,均为全球前2%顶尖科学家。公司研发团队共363人,占总员工数的52.2%。
近年来,中国高度重视物联网产业的发展,预计AIoT市场规模将从2023年的8210亿元增长至2028年的13930亿元,复合年增长率11.1%。特斯联凭借其全栈产品、行业知识和运营能力,有望抓住中国公域AIoT行业的重大增长机遇。
特斯联计划将上市募集资金用于增强研发能力(包括TacOS、绿色智算体及领域大模型研发)、扩展商业化及市场份额、提升国内外市场渗透率,并通过战略投资和收购增强竞争力。

大模型日报(9月29日 资讯篇)

https://mp.weixin.qq.com/s/Q7gOJ_JyrzKzRXOwXrHv2g
02
NVIDIA 5090显卡曝光:32GB GDDR7内存、21760 CUDA核心,功耗高达600W引发热议

知名爆料人士kopite7kimi披露,英伟达下一代旗舰消费级显卡5090将采用32GB GDDR7内存、21760个CUDA核心,功耗(TGP)达600W,比上一代旗舰4090的450W高出三分之一。另一款显卡5080的内存容量仅为5090的一半(16GB),且整体性能配置也为5090的一半,引发部分网友猜测5090可能是由两块芯片拼接而成的设计。
5090和5080均采用3nm制程的Blackwell架构GPU,型号分别为GB202-300和GB203-400,支持最新一代GDDR7显存,并可能在CES 2025后发布。由于采用新出的PCIe 5.0接口,用户若主板为PCIe 4.0则需更换主板才能使用50系显卡。
尽管5090的高功耗引发了“启动时会导致街区灯光变暗”等调侃,但其强大的性能配置吸引了游戏玩家和AI/ML从业者的关注。AI/ML领域对本地算力的需求增长,促使5090成为这一市场的潜在热门产品。同时,4K游戏画质提升的瓶颈可能导致高端显卡市场需求饱和,但未来随着游戏中AI技术的应用,可能会催生对GPU性能的新需求。
目前,关于5080将推出24GB内存版本的消息还处于传闻阶段。5090和5080的架构信息最早在2021年被kopite7kimi以美国数学家David Blackwell的照片形式暗示,当时被认为是Ampere架构之后的下下代预测,如今几乎完全符合英伟达发布的技术路线。虽然目前所有信息尚未得到官方确认,但5090有望进一步巩固英伟达在消费级显卡市场的地位。

大模型日报(9月29日 资讯篇)

https://mp.weixin.qq.com/s/ab-dPHHAZyVgKCmdP6SbtA
03
融资前夕管理层动荡,OpenAI面临技术与商业化双重挑战

在不到两年的时间内,OpenAI从AI圈内领先的实验室发展成为全球知名企业,但近期高层管理层的变动引发了外界关注。今年9月,CTO Mira Murati、首席研究官 Bob McGrew 和 Post Training 研究副总裁 Barret Zoph 相继辞职,成为OpenAI技术领导层的重大变动。而这次变动正值OpenAI即将完成可能是硅谷史上最大一轮65亿美元融资的关键时刻。
据悉,Murati离职前,OpenAI联合创始人John Schulman已于8月跳槽至竞争对手Anthropic。与此同时,OpenAI宣布正在改变公司结构,计划从非营利部门转型为面向盈利的公司,但这一转型过程面临挑战,甚至导致苹果退出最新一轮融资。
管理层动荡让外界对OpenAI的发展前景产生疑问。内部员工认为,OpenAI仓促发布产品并进行安全测试,失去对竞争对手的领先优势。奥特曼自去年11月复职以来,公司员工人数从770人增至1700人,并引入首席财务官和首席产品官。但快速扩张也引发了内部矛盾。CTO Murati因对公司急于推出GPT-4o和相关语音功能不满而离职,而公司内部对高额融资和巨额盈利的追求可能削弱了原本专注于研究的文化。
尽管OpenAI的营收增长迅速,年化收入已达37亿美元,但预计今年仍将亏损50亿美元。公司计划在下轮融资中将估值提升至1500亿美元。激烈的市场竞争和内部管理问题让许多投资者对OpenAI能否持续保持技术优势感到担忧。

大模型日报(9月29日 资讯篇)

https://mp.weixin.qq.com/s/sl9PmWJfwUvc7kkN8DR_PQ
04
英特尔最新发布至强(® )6 性能核处理器

英特尔最新发布的至强® 6性能核处理器(P-core系列)彻底改变了服务器CPU领域的竞争格局。此次至强® 6采用模块化设计,将计算芯片单元与I/O芯片单元解耦,实现核心数量灵活组合和内存、I/O同步强化,突破了过去单纯追求核心数量的局限。旗舰型号6900P系列拥有128个核心和504MB L3缓存,支持6400MT/s DDR5内存、8800MT/s MRDIMM内存、96条PCIe 5.0通道及CXL 2.0互连技术,显著提升了AI推理和数据处理性能。
这一代产品不仅在算力上实现质的飞跃,还引入了多项创新技术,如全新的CXL 2.0、Intel® AMX加速器对FP16数据类型的支持及独占的“Flat”内存模式,打破传统内存扩展瓶颈,最大化提升内存利用率。此外,至强® 6在安全性上引入TDX方案,为AI数据中心的关键数据提供更强保障。
在AI服务器应用中,至强® 6既可单独加速AI推理,又可作为主控CPU与GPU及其他AI加速器协作,提升整体系统性能。英特尔通过与TensorFlow、PyTorch深度合作优化软件生态,让这款CPU成为AI推理场景下的有力选项。至强® 6处理器的出现,将进一步巩固英特尔在AI计算领域的地位,并成为AI服务器及数据中心的优选解决方案。

大模型日报(9月29日 资讯篇)

https://mp.weixin.qq.com/s/s321GegSdIB8dSa9StOYKg

推特

01
开源 LLM 库 LitGPT:专注于效率和代码可读性,允许你在云端或笔记本电脑上微调和使用这些模型

我刚刚将新的 Llama 3.2 1B 和 3B 模型添加到了我帮助开发的开源 LLM 库 LitGPT,该库专注于效率和代码可读性。
LitGPT 允许你在云端或笔记本电脑上微调和使用这些模型。
所以,如果你周末想找点东西玩:
1. 微调模型
litgpt finetune_lora meta-llama/Llama-3.2-1B –data JSON –data.json_path my_custom_dataset.json –train.epochs 1 –out_dir out/llama-3.2-finetuned –precision bf16-true
2. 与模型对话
litgpt chat out/llama-3.2-finetuned/final
3. 通过 API 端点提供模型服务
litgpt serve out/llama-3.2-finetuned/final

大模型日报(9月29日 资讯篇)

https://x.com/rasbt/status/1840011994423873924
02
VARAG – 视觉优先 RAG 引擎,视觉增强检索与生成

基于视觉的(Colapli)RAG 正变得越来越流行,因此我们构建了一个平台来进行比较:
  • 简单的 OCR RAG
  • VisionRAG
  • Colpali
  • 混合 Colpali
🚀 推出 VARAG – 视觉优先 RAG 引擎(视觉增强检索与生成)。

大模型日报(9月29日 资讯篇)

https://x.com/adithya_s_k/status/1840028869195112534
03
“将 OpenAI 转变为一家真正的企业正在让它四分五裂”引热议,OpenAI 加速 GPT-4o 的发布后发现具有风险

LeCun:这是一篇非常有趣的文章,讨论了 OpenAI 最近的转型和新的运作模式,这促使许多联合创始人、高管和专注于研究的人离开。
将一个非盈利的开放研究机构转变为一个保密的、以产品为中心的盈利公司,必然会导致许多人选择退出。
Journalist Garrison:
这篇文章充满了爆炸性新闻。Deepa Seetharaman 的报道非常出色。
最重磅的:OpenAI 加速了 GPT-4o 的测试(已有报道),发布了该模型,然后才发现这个模型太具有风险,不适合发布!我在即将发布的内容中也遇到了类似的情况…

大模型日报(9月29日 资讯篇)

https://x.com/ylecun/status/1839726968444518772
04
Seong Joon Oh建立ResearchTrendAI:通过底层 AI 技术,使研究更新和展示更加可管理、随时随地可访问且可扩展

在读博期间,我每天都会浏览 arXiv 上所有的 AI 论文。
如今,博士生们每天面临的论文量是过去的 10 倍。这从根本上改变了 AI 研究的进行方式。我们现在依赖像 Twitter 和 LinkedIn 这样的平台来发现和讨论最新的论文。
但即使在社交媒体上有成千上万的连接,我仍然感到缺少那种社区感。在 2010 年代,我几乎能说出全球所有从事我研究领域的博士生和实验室的名字。在会议上交流变得很容易,并能形成持久的联系。今天,这几乎变得不可能了。
但我不认为这必须成为新常态。一个新时代需要新的解决方案。这就是为什么我们正在构建 #ResearchTrendAI —— 通过底层 AI 技术,使研究更新和展示更加可管理、随时随地可访问且可扩展。大模型日报(9月29日 资讯篇)

https://x.com/coallaoh/status/1839588920402600303

产品

01
panda{·}etl (YC W24)

panda{·}etl 是一款自动化文档工作流工具,可以将杂乱的文件转化为可操作的数据。用户可以上传多种文件格式,定义所需数据点,并利用 AI 提取功能生成可导出的电子表格,便于追踪数据来源。该工具适用于个人、企业和大型企业,提供灵活的计划和定制解决方案,以解决数据分析师在文档处理中的常见问题。

大模型日报(9月29日 资讯篇)

https://panda-etl.ai/

02

Podsnap

PodSnap.AI 是一款 AI 应用,提供播客节目的实时文本和音频摘要,帮助用户快速了解新发布的内容。支持超过 420 万个播客,用户可以免费关注热门节目,并享受限时折扣。该应用仍在测试阶段,欢迎用户反馈以便持续改进。

大模型日报(9月29日 资讯篇)

https://podsnap.ai/

投融资

01
Tetrix 获得 500 万美元种子轮融资

Tetrix 是一家总部位于纽约的公司,提供面向资本配置者的人工智能驱动分析平台,近期完成了 500 万美元的种子轮融资。本轮融资由 Innovation Endeavors 领投,参与投资的还包括来自 Blackrock、CPPIB(加拿大养老金投资委员会)、SoftBank(软银)、Lending Club(借贷俱乐部)和 Plaid 的知名天使投资人。
Tetrix 计划利用这笔资金扩展其专有的数据收集、提取和分析平台。公司由首席执行官 Olivier Babin 和 Naunidh Singh Bhalla 领导,通过人工智能驱动的洞察能力为投资者提供更为智能的决策支持,专注于提升另类投资市场的决策效率。其平台可以自动从基金报告中收集数据,提取关键信息,并提供清晰、可操作的投资分析和洞察。
CEO Olivier Babin 表示,过去十年,投资格局从公共市场转向私募市场,私募市场的资产规模已增加四倍,而现有的技术基础设施无法满足投资者的需求。Tetrix 利用最新的人工智能技术,将从报告到可操作投资数据的时间从 45 天缩短至 1 天,每年为资本配置者节省超过 4,000 小时的人工劳动时间,并为其另类投资组合提供 10 倍深度的洞察力。
公司官网:https://www.tetrix.co/

大模型日报(9月29日 资讯篇)

https://www.finsmes.com/2024/09/tetrix-raises-5m-in-seed-funding.html
推荐阅读
  1. 「草莓」OpenAI o1大模型信号看板大汇总!!
  2.   The theory of LLMs|朱泽园ICML演讲整理
  3.   寒武纪视觉爆炸:多模态大模型在视觉处理中的新探索

— END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/09/21369.html

Like (0)
Previous 2024-09-29 19:45
Next 2024-09-30 20:01

相关推荐