大模型日报(7月8日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(7月8日 资讯篇)

资讯

01

像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了

生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构。然而,人工神经网络主要被设计为静态的、完全连接的结构,在面对不断变化的环境和新的输入时可能非常脆弱。尽管研究人员对在线学习和元学习进行了大量研究,但目前最先进的神经网络系统仍然使用离线学习,因为这与反向传播结合使用时更加简单。那么,人工神经网络是否也能拥有类似于高度可塑性的性质?来自哥本哈根信息技术大学的研究团队提出了一种自组织神经网络 ——LNDP,能够以活动和奖励依赖的方式实现突触和结构的可塑性。
大模型日报(7月8日 资讯篇)https://mp.weixin.qq.com/s/fdQcKpuu75C3lgFkxfpwdQ
02

单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

大型语言模型 (LLM) 已进入长上下文处理时代,其支持的上下文窗口从先前的 128K 猛增到 10M token 级别。然而,由于注意力机制的二次复杂度,模型处理输入提示(即预填充阶段)并开始产生第一个 token 可能需要几分钟时间。导致首个 token 生成的时间过长,从而严重影响了用户体验,这也极大地限制了长上下文 LLM 的广泛应用。 自注意力计算的开销占到了总预填充延迟的 90% 以上,这使其成为 LLM 处理长上下文时的主要瓶颈。现有的加速预填充方法在应用于长上下文 LLM 时通常无法保持可接受的准确性或效率。为了解决上述问题,来自微软、萨里大学的研究者提出了一种旨在加速长序列处理预填充的稀疏计算方法:MInference( Milliontokens Inference )。
大模型日报(7月8日 资讯篇)https://mp.weixin.qq.com/s/aeGqsPIKnnNZEW-i02TcMw

推特

01

Tom Yeh 为AI by Hand开发工具:人们可以创建自己的AI by Hand练习,包括自定义数字和解决方案

[Transformer] by Hand ✍️
自己动手制作 🛠️👉 https://by-hand.ai/sp/tfmr
在过去的几个月里,我与几位AI教育工作者合作,定制了我的AI by Hand练习。我很高兴我的材料在全球许多课堂上得到了使用和认可!
然而,因为整个定制过程都是手工完成的,所以有时我的解决方案会包含错误,这些错误最终被学生们发现。这实际上让我很开心,因为这说明学生们在认真学习。😅
最近,我一直在考虑开发一个工具,让人们可以创建自己的AI by Hand练习,包括自定义数字和解决方案。
在考虑了一系列技术之后,我决定使用Google表格。我的目标是最大化覆盖面并扩大访问范围。
由于这个工具仍处于早期阶段,我非常感谢您的反馈!
接下来您希望看到哪些其他主题呢?

大模型日报(7月8日 资讯篇)https://x.com/ProfTomYeh/status/1809939766907228334

02

远程低成本人工遥控机器人的时代是否要来临?或能解决数据受限

最近和一家资金充足的机器人初创公司创始人聊过,他证实了这种玩法。目前机器人主要是数据受限。
便宜的机器人 -> 遥控操作用于实际劳动
大量的遥控操作数据 -> 机器人基础模型
正如@BasedBeffJezos所说,这是科技资本的时间钳子。

大模型日报(7月8日 资讯篇)https://x.com/khoomeik/status/1810086875518140481

03

Veridian:用智能代理和大型语言模型来自动化清理数据的过程

清理数据很麻烦,所以我花了一个月的时间用智能代理和大型语言模型来自动化这个过程。
如果你想使用它或者有反馈,请在下方告诉我!

大模型日报(7月8日 资讯篇)https://x.com/AI_Arav/status/1809700233133113617

04

Danb分享Demo:深度Q学习算法在音频可视化工具中玩六维贪吃蛇

大家是世界上第一批看到深度Q学习算法在音频可视化工具中玩六维贪吃蛇的人。

RL实验
六维贪吃蛇深度Q学习音频可视化工具

大模型日报(7月8日 资讯篇)https://x.com/dnbt777/status/1809975013606650205

05

threedsvg:立即将任何SVG标志转换为3D

是时候了⚡️
终于发布了threedsvg,和 @notrohan_ 一起合作
立即将任何SVG标志转换为3D✨
在下面试试吧 👇
https://www.threedsvg.com/

大模型日报(7月8日 资讯篇)https://x.com/MalayVasa/status/1809627318308032827

产品

01

Onyxium AI

Onyxium 是一个集成了各种 AI 工具和功能的综合性平台,希望让人工智能技术变得更加友好易用。它被描述为一个”终极中心”,提供了从内容创作到数据分析等各种 AI 应用,让用户可以在一个地方找到所需的一切。Onyxium 的目标是让人工智能不再神秘,更像是一个可靠的伙伴,帮助用户提高创造力和生产力。它被定位为一个”悠闲、多合一、经济实惠的 AI 伙伴”,能够满足用户的各种需求。
大模型日报(7月8日 资讯篇)https://onyxium-ai-xi.vercel.app/
02

MindPal

MindPal 是一款革命性的 AI 工具,可以让用户在短短 5 分钟内构建各种内部 AI 工具,包括可完全定制的智能 AI 代理和多代理协作工作流。使用这些功能,用户可以自动化大量任务,从内容再利用到销售提案,从市场研究到社交媒体内容都可以覆盖,大幅提高工作效率。
大模型日报(7月8日 资讯篇)https://mindpal.space/

投融资

01

为国央企提供AI智能自动化平台,「九科信息」完成数千万元B1轮融资

「九科信息」近日完成数千万元人民币B1轮融资,由诺辉基金领投,老股东深创投索斯福跟投。本轮融资将用于产品研发、市场开拓及运营管理。「九科信息」专注于“RPA+AI”智能自动化平台,助力国央企数智化转型,提供包括智能文档处理平台和智能知识助手在内的多款创新产品,已在金融、能源、制造等领域应用,并通过多家大型国央企的复杂场景验证。
公司官网:https://www.ninetechone.com/
大模型日报(7月8日 资讯篇)https://36kr.com/p/2852919296953225
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/07/14215.html

Like (0)
Previous 2024-07-08 18:04
Next 2024-07-09 17:46

相关推荐