我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
资讯
特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了

速读60万字《马斯克传》、手机一键生成PPT,零一万物上线AI生产力工具「万知」

爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP

一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

仅用250美元,Hugging Face技术主管手把手教你微调Llama 3
-
设置开发环境 -
创建并加载数据集 -
使用 PyTorch FSDP、Q-Lora 和 SDPA微调大语言模型 -
测试模型并进行推理

LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
https://mp.weixin.qq.com/s/9GkSQkEax3D5boQQ9LNIRQ
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
-
调整位置编码:用NTK-aware插值初始化RoPE theta的最佳调度,进行优化,防止扩展长度后丢失高频信息 -
渐进式训练:使用UC伯克利Pieter Abbeel()团队提出的Blockwise RingAttention方法扩展模型的上下文长度

Sam Altman 《麻省理工科技评论》最新采访:AI 杀手级功能,不需要新的硬件和训练数据,并且了解你的一生……

新SOTA,仅几个标记基因即可自动标记,复旦大学开发空间转录组学语义注释贝叶斯框架

耐600℃高温存储器问世,有助开发极端环境下人工智能计算系统

推特
脉冲星:首创的家族化软件定义电磁战系统,快速识别并应对新威胁
https://x.com/anduriltech/status/1787452286542708857
LeRobot:Hugging Face 的第一个机器人技术库推出,旨在促进更大的开源机器人社区

用大型语言模型处理文件:发票或收据!
https://x.com/andrejusb/status/1787385531770265800
DeepSeek-V2,开源MoE模型,AlignBench 中名列前三
在 AlignBench 中名列前三,超过 GPT-4 并接近 GPT-4-Turbo。 在 MT-Bench 中排名顶级,与 LLaMA3-70B 竞争并超过 Mixtral 8x22B。 擅长数学、编程和推理。 支持 128K 上下文窗口。
创新架构,活跃参数 21B,总参数 236B。 无与伦比的 API 价格,同时保持真正的开源和无商业化。

Wayve AI C轮获投10.5亿美元,将用于开发汽车用具身AI产品
https://x.com/wayve_ai/status/1787618605468704998
OpenAI API现在可以查看统计数据,流式传输的末尾额外显示
stream_options: {"include_usage": true}
后,您将在流的末尾看到一个额外的块,其中填充了使用情况数据。
产品
Actionize AI

ContentPie

米兰教育科技公司Futura获得1400万欧元A轮融资
https://www.eu-startups.com/2024/05/milan-based-edtech-futura-raises-e14-million-series-a-to-make-the-world-learn-faster-and-better/
Tekst.com获得70万欧元融资

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/05/15566.html