大模型日报（4月7日资讯篇）

欢迎观看大模型日报，如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。

欢迎大家一起交流！

推特

斯坦福大学24Spring再次开设Transformers课程，面向公众开放

我们将在2024年春季再次开设斯坦福大学CS 25 Transformers课程(https://cs25.stanford.edu)!这是斯坦福大学最热门的研讨课之一。我们通过Zoom向公众开放课程。讲座从今天(周四)开始,下午4:30-5:50(太平洋夏令时),链接为

https://stanford.zoom.us/j/99922151759?pwd=dW5CcUtVYkNybGZGY0hMWUZtVkZBZz09…

讲座将被录制并在每次讲座后约2周发布。每周,我们都会邀请处于Transformers研究前沿的人士讨论最新突破,从GPT和Gemini等LLM架构到在生成艺术(如DALL-E和Sora)、生物学和神经科学应用、机器人等方面的创新应用!

CS25已成为斯坦福大学最热门、最令人兴奋的研讨课之一。我们邀请来自工业界和学术界的最酷的演讲者,包括来自@OpenAI、@GoogleDeepMind、@nvidia、@Meta、@AnthropicAI等的人士。过去的演讲者包括@karpathy、@geoffreyhinton、@DrJimFan、@ashVaswani、@_jasonwei、@vivnat、@xiao_ted、@janleike、@YejinChoinka、@douwekiela等等![附上与其中一些人的合照]

我们的课程在斯坦福内外都非常受欢迎,YouTube上的总浏览量约为100万次[https://youtube.com/playlist?list=PLoROMvodv4rNiJRchCzutFw5ItR_Z27CM…]

我们与@karpathy的课程是斯坦福2023年上传的YouTube第二大热门视频

[https://youtube.com/watch?v=XfpMkf4rD6E&ab_channel=StanfordOnline…]

浏览量超过50万次!

这一次我们有了显著改进,包括一个大型演讲厅、专业录制和直播等。此外,所有人都可以旁听和在线直播。欢迎大家亲自旁听或通过Zoom直播加入。我们还有一个Discord服务器[https://discord.gg/2vE7gbsjzA](超过2000名成员),用于讨论Transformers。我们将其作为一个面向公众的”Transformers社区”。欢迎大家加入并与他人交流!

感谢我的联合讲师@DivGarg9 @EmilyBunna @shljessie1,以及课程的教员顾问@chrmanning!

更多详情:https://cs25.stanford.edu

https://x.com/stevenyfeng/status/1775972154938659184

吴恩达谈AI虚拟女友/男友：努力减少人类的孤独感是一个非常好的目标

吴恩达：《金融时报》有一篇由Madhumita Murgia 撰写的关于Renate Nyborg 在 Meeno工作的优秀文章。这篇文章需要付费阅读,但我很感谢Renate(以及哈佛大学的 @ronivey)在谈到AI虚拟女友/男友行业的危险以及可能导致更多孤独感的风险时所展现的领导力。Renate说:”男人们不想去见女孩,因为他们有虚拟女友,这些虚拟女友说的正是他们想听的话。”对于想知道AI有哪些风险应用的监管者来说,我建议他们看看虚拟女友/男友行业!相比之下,Meeno为人际关系提供建议,致力于将人们聚集在一起。努力减少人类的孤独感是一个非常好的目标!

https://x.com/AndrewYNg/status/1776737961243218134

Santiago分享如何使用Python构建你的第一个数据管道:简单易懂的分步指南

数据管道将让你进入市场的前1%。仅仅了解Python是不够的。你需要理解如何在生产应用中使用它来操作数据。这里是你在网上能找到的关于如何构建你的第一个管道的最简单的解释(使用Python——世界上最好的编程语言)。

首先,在构建生产应用时有三件事你需要注意:

• 你需要它可靠

• 你需要它可扩展

• 你需要它高效

如果不使用管道来编排过程,你无法实现这些。要构建你的第一个管道,你需要了解几个概念:

数据节点:它们表示你想要加载、操作或保存的任何数据。
任务:这些是将与数据交互的函数。

管道将数据节点与任务结合在一起。就这么简单!

在这个短视频中,我构建了一个简单的管道来处理一些数据集列。我使用的是Taipy,这是一个开源库,让你可以构建和编排管道。给他们的GitHub仓库加星:https://github.com/Avaiga/taipy

看看这个视频。再简单不过了!

感谢Taipy背后的团队与我合作完成这篇文章。

https://x.com/svpino/status/1776594015695130758

初创Founder Taelin悬赏使用提示工程GPT谜题 A::B，Taelin：这证明了GPT在训练集之外没有推理能力

一个GPT永远无法解决的简单谜题:

作为一个优秀的程序员,我喜欢将问题以最简单的形式隔离。因此,当你发现自己试图解释为什么GPT永远无法达到AGI时,只需向他们展示这个提示。这是一个非常简单的问题,大多数孩子应该能够在一分钟内阅读、学习和解决;然而,所有现有的人工智能都惨遭失败。试试看!

这也很好地证明了GPT在训练集之外没有推理能力,并且永远无法开发新的科学。毕竟,如果一个普通的15岁孩子在任何给定的智力任务中都能击败你,我不会对你解决癌症寄予太大希望。

在花费7万亿美元训练GPT之前,请记住:它仍然无法解决这个任务。也许是时候寻找新的算法了。

A::B提示挑战:证明我错了可获得1万美元!

#挑战

开发一个AI提示,以90%以上的成功率解决A::B问题(在引用的推文中定义)的随机12个令牌实例。

#规则

AI将在<problem/>标签内获得一个随机实例。
AI必须以正确的<solution/>结束其答案。
AI最多可以使用32K个令牌来解决问题。
你可以选择任何公共模型。
允许使用任何提示技术。
保持乐趣!不要有毒性、垃圾信息或骚扰。

#评估

你必须在对这条推文的回复中提交你的系统提示,使用Gist。我将在A::B系统的50个随机12令牌实例中测试每个提交。第一个获得45个正确解的人将赢得奖金,外加证明我错了的宝贵公众认可。

如果没有人解决它,我会重新发布前3名提交,这样我们都可以学到一些新的提示技巧:)

#关于GIST的详细信息

https://gist.github.com/VictorTaelin/8ec1d8a0a3c87af31c25224a1f7e31ec

https://x.com/VictorTaelin/status/1776677635491344744

xz sshd后门兔子洞更深后门：blasty分享如何探索更难触及的功能

xz sshd后门的兔子洞还有更深的地方。我刚才成功触发了后门的一些更难触及的功能。还有更多需要探索。

这需要向RSA_public_decrypt钩子发送一个精心制作的命令,然后它会为`mm_answer_keyallowed` sshd函数安装另一个钩子。随后你提供N个以特殊方式制作的假ssh-rsa公钥,将它们拼接在一起,形成一个包含更多后门命令的”魔法缓冲区”,这个缓冲区还有两个额外的ed448签名。这些签名与RSA_public_decrypt部分的后门签名一样,都使用主机密钥的SHA256摘要作为盐。

最后的签名还考虑了会话ID(0x20字节),这个ID是在SSH会话的初始密钥交换(KEX)期间派生的。我当前的PoC实现使用了一个大量monkey patch过的paramiko(ssh客户端)库来实现这一点。

目前我只是在代码的这一部分触发了命令0x03,它允许通过system()再次进行基本的RCE(还允许你设置uid/gid)。但还有更多的代码需要理解。看起来完全的认证绕过(交互式会话)是可能的!(这个结论是基于这样一个事实:mm_answer_keyallowed后门命令之一最终也会hook mm_answer_keyverify)

设计这些东西的人必须深入研究openSSH(d)的内部原理(我过去几天也是如此)。再次致敬:)

认证绕过已确认! INFO:paramiko.transport:Authentication (password) successful! mm_keyallowed_backdoor cmd 1允许用自定义响应覆盖mm_answer_authpassword的响应。如果将其设置为{u32(9), u8(13), u32(1), u32(0)},你可以使用任何密码登录。

https://x.com/bl4sty/status/1776691497506623562

Gemma 1.1 7B & 2B – 指令调优版本：在质量、编程能力、事实性和指令遵循方面有显著提升

更新:Gemma 1.1 7B & 2B – 指令调优版本!

在质量、编程能力、事实性和指令遵循方面有显著提升。

更好的多轮对话质量。

https://huggingface.co/google/gemma-1.1-7b-it

https://x.com/reach_vb/status/1776388497609224688

Nash分享免费开源 perplexity AI 平替：FreeAskInternet

免费开源 perplexity AI 平替：FreeAskInternet

🈚️ 完全免费 ( 无需任何 API key)

💻 完全本地运行 ( 无需 GPU )

🔐 完全隐私 (本地运行)

🚀 Docker一键部署

这个项目是我的一个小实验，今天下午花了3小时完成，借助 FreeGPT35 以及 searxng，感谢

🌟欢迎 Star

项目地址：

https://github.com/nashsu/FreeAskInternet

https://x.com/nash_su/status/1776175795654086945

资讯

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

来自谷歌 DeepMind的研究者提出了 Gecko，这是一种从 LLM 中蒸馏出来的多功能文本嵌入模型，其在 LLM 生成的合成数据集 FRet上进行训练，并由 LLM 提供支持。通过将 LLM 的知识进行提炼，然后融入到检索器中，Gecko 实现了强大的检索性能。在大规模文本嵌入基准（MTEB，Massive Text Embedding Benchmark）上，具有 256 个嵌入维度的 Gecko 优于具有 768 个嵌入尺寸的现有模型。具有 768 个嵌入维度的 Gecko 的平均得分为 66.31，在与 7 倍大的模型和 5 倍高维嵌入进行比较时，取得了相竞争的结果。

https://mp.weixin.qq.com/s/5e_Py_Xm0RsmP1YMcikpaQ

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

在大模型落地应用的过程中，端侧 AI 是非常重要的一个方向。近日，斯坦福大学研究人员推出的 Octopus v2 火了，受到了开发者社区的极大关注，模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行，在准确性和延迟方面超越了 GPT-4，并将上下文长度减少了 95%。此外，Octopus v2 比 Llama7B + RAG方案快 36 倍。

https://mp.weixin.qq.com/s/qnFZOPLpdRxW42_cLUcImA

金山办公 WPS 365 宣布 4 月 9 日全新发布：“一站式 AI 办公”

金山办公生产力大会官宣 4 月 9 日 15 点举行，宣称“WPS 365 全新发布”。官方海报写有“一站式 AI 办公生产力即刻起飞”，暗示 WPS 365 将迎来更多 AI 功能升级。2023 年 4 月，金山办公面向政企客户发布了数字办公品牌 WPS 365，该服务提供一系列内容创作应用和办公协作工具，涵盖了内容创作、沟通创作、数字资产管理、开放生态四大版块，包含 WPS Office、文档中心、金山协作、金山会议、邮件、日历等通用办公套件。

https://www.ithome.com/0/760/314.htm

揭秘AI幻觉：GPT-4V存在视觉编码漏洞，清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力，成为如今最领先的多模态大模型。然而，近期很多工作发现 GPT-4V 在很多基本能力上却意外的出现短板。例如，在微软一篇长达 166 页的技术报告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中，作者发现，对于一个不太复杂的图像中的苹果数量，GPT-4V 竟然怎么数也数不对。然而，学术界和工业界尚不清楚导致这些问题的底层原因。这个问题在清华大学、新加坡国立大学和中国科学院大学的一篇题为《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的论文中得到了解释。

https://mp.weixin.qq.com/s/5CKBR_KA-YNIqkz1ZcC79A

二次元专用超分AI模型APISR：在线可用，入选CVPR

《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分，它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候，我们会突然有重温这些童年回忆的冲动，但我们却可能会略带遗憾地发现这些童年回忆的分辨率非常低，根本无法在客厅的 4K 大屏电视上创造出良好的视觉体验，以至于可能阻碍我们与在高分辨率数字世界中成长的孩子分享这些童年回忆。针对这样的困扰（以及潜在的市场），一种做法是由动画公司制作重制版，但这项任务的人力和资金成本都不低。而随着多模态人工智能的性能日益强大，采用基于 AI 的超分辨率技术来提升动漫分辨率也成为了一个值得探索的方向。近日，密西根大学、耶鲁大学和浙江大学的一个联合团队通过分析动漫的制作过程，为动漫超分辨率任务创造出了一套相当实用的新方法，其中包括数据集、模型和一些改进措施（该论文已被 CVPR 2024 接收）。该团队也开源了相关代码，并在 Huggingface上线了一个试用模型。

https://mp.weixin.qq.com/s/9pxlR4Ul9H7jhdERkaBtLw

产品

Karma

Karma 是一款可帮助用户在网上购物时做出正确决定的产品，节省时间和金钱。不仅是一款APP，也可以使用浏览器插件的形式，方便用户随时使用。用户可以使用 Karma 保存物品，并在价格下降或物品补货时收到通知，同时借助价格比较功能，确保用户始终支付最优惠的价格。

https://www.karmanow.com/

Dealwise

Dealwise 是一款面向初创公司的人工智能并购顾问。它旨在帮助收入在 100 万美元到 1000 万美元之间的软件初创公司的创始人找到出口。Dealwise 提供诸如识别接触财务和战略买家、谈判、贷款资格预审和托管等服务，并利用人工智能来识别更相关的买家，以确保最大限度地提高退出率。平台在短短三个月内已经完成了一笔交易，并有两笔交易正在报价中。