
MOLAR FRESH 2021年第19期
人工智能新鲜趣闻 每周一更新
KG4SL:用于人类癌症合成致死预测的知识图神经网络
上海科技大学郑杰教授课题组在2021年7月份发表在《Bioinformatics》上的一篇文章《KG4SL: knowledge graph neural network for synthetic lethality prediction in human cancers》使用了知识图神经网络方法来进行癌症合成致死的预测任务。
知识图是一种多关系图,其中节点和边具有不同的类型。通过将KG合并到GNN中,可以通过直接在图中引入这些潜在因素作为节点来缓解上述独立性问题。在此,作者提出了一种新的基于kgnn的SL预测方法KG4SL,该方法利用KG MP作为后端。作者通过在KG中注入各种可能与SL相关的生物过程、疾病、化合物等因素来解决独立性问题。模型由三部分组成。在第一部分中,作者从每个基因的原始KG推导出一个基因特异性子图。在第二部分中,作者在基因特异性子图上进行MP,自动将基因与可能在识别SL pair中起决定性作用的因素关联起来。在第三部分中,作者定义了一个以监督方式重构基因-基因相似度的译码器。

作者的模型在AUC,AUPR和F1指标上优于所有最先进的baseline方法。作者进行了大量的实验,将KG4SL与无监督的TransE模型、一个普通的图卷积网络模型以及它们的组合的比较,证明了将KG纳入GNN中对SL预测的显著影响。
(来源:AI in Graph)
Science论文:诺奖经济学家的经典决策模型,被AI挑战
摆在你面前的是这两个选项:20% 概率得到 100 美元,80% 的概率得到 50 美元。你会选择哪个?
在经济学领域,这个问题与一个著名的理论息息相关。那便是诺贝尔经济学奖获得者卡尼曼在 1979 年提出的前景理论(Prospect Theory)。尽管前景理论隶属于经济学范畴,另一方面,这个理论也反映了智能体在决策认知上存在的误区。
普林斯顿大学的研究人员 Joshua Peterson 所在的团队发表于 Science 的研究论证了机器学习为行为科学领域带来新的可能性。他们通过亚马逊的 Mechanical Turk 众包服务,开发了一个大型的风险决策数据集,收集了人类对近 10000 个 风险选择问题的决定,利用这个数据集来训练了一个深度神经网络,用以来预测人类行为,并系统地比较了这大模型与此前的小模型(如前景理论)对风险决策行为的预测能力。

在他们的实验中,这由这个数据集驱动的深度神经网络可以模仿人类的决定,其准确度胜过了所提出的 50 多种风险决策理论,这表明目前的理论仍存在着差距。
(来源:数据实战派)
Science | 面对alphafold,学术界没有躺平:RoseTTAFold挑战蛋白复合物预测
2021年7月15日,华盛顿大学蛋白设计研究所David Baker教授课题组及其他合作机构在Science上发表论文”Accurate prediction of protein structures and interactions using a three-track neural network”,公布了其开源蛋白质预测工具RoseTTAFold的研究结果。团队及其他合作机构在探索了结合相关思想的网络架构,并通过三轨网络获得了最佳性能。三轨网络产生的结构预测精度接近 CASP14 中的 DeepMind团队的AlphaFold2。

受到DeepMind团队AlphaFold2结果的启发,研究人员探索了包含这五种特性的不同组合的网络架构。在没有公开的方法的情况下,研究人员尝试了多种方法来在网络的不同部分之间传递信息,成功地产生了一个“双轨”网络,其中信息沿着一维序列对齐轨迹和二维距离矩阵轨迹并行流动。
研究人员研究了 RoseTTAFold 的效用,以促进通过 X-ray 晶体学和冷冻电子显微镜确定实验结构,并建立模型,为目前未知结构的关键蛋白质提供生物学见解。通过分子置换(MR)解决X-ray结构通常需要非常准确的模型。RoseTTAFold 方法的准确度比目前可用的方法高得多。
对具有确定结构的 GPCR 序列进行的基准测试表明,即使在没有已知结构的密切同源物的情况下,RoseTTAFold 模型对于活跃和不活跃状态也可以非常准确。
(来源:DrugAI)
机器学习策略可以减少人们对食物中纳米粒子的担忧
在农业中,纳米颗粒可用作抗菌剂以保护植物免受病原体侵害。或者,它们可用于与肥料或杀虫剂结合,然后通过编程缓慢释放以增加植物吸收。
在《Environmental Science & Technology》杂志在线发表的一项新研究中,德克萨斯 A&M 大学的研究人员使用机器学习来评估金属纳米粒子的哪些显着特性使它们更容易被植物吸收。研究人员表示,他们的算法可以表明植物在根和芽中积累了多少纳米颗粒。

研究人员选择了两种不同的机器学习算法,人工神经网络和基因表达编程,首先在一个数据库上训练这些算法,该数据库是根据过去对不同金属纳米粒子及其积累的特定植物的研究而创建的。特别是,他们的数据库包含不同纳米粒子的大小、形状和其他特征,以及这些粒子有多少从土壤或富含营养的水中吸收到植物体内的信息。
一旦经过训练,他们的机器学习算法就可以正确预测给定金属纳米颗粒在植物物种中积累的可能性。此外,他们的算法表明,当植物处于营养丰富或水培的溶液中时,金属纳米颗粒的化学组成决定了根和芽中积累的倾向。但如果植物在土壤中生长,土壤中有机质和粘土的含量是纳米颗粒吸收的关键。
(来源:FoodAI)
聊天机器人有了长期记忆,遇到不懂的还能上网搜索,网友:像极了不懂装懂时偷偷百度的我
尽管从GPT-3开始,AI生成的文本已经能做到以假乱真,但这仅限于生成一段话。
在连续聊天中,AI不会记得自己之前说过的话,就像下面这样:

现在,Facebook AI团队终于推出BlenderBot2.0,在1.0基础上添加了长期记忆和即时搜索功能。首先记住自己说过的话和人类说过的话,避免后续聊天中出现矛盾。如果人类提到了AI不知道的东西,还能偷偷上网搜索。
这次升级的重点是一个检索增强算法,能从过去对话记忆和互联网上的资料中提取出能用在当前对话的信息。

实验结果上,BlenderBot2.0对之前对话内容的使用率提高了55%,在对话中的事实一致性提高了12%,而人类评估员打出的分数提高了17%。能上网搜索信息还让AI能够参与人类世界中最新的话题,比如谈论新上映的电视剧。
(来源:量子位)
END

掌握AI咨询
了解更多科技趣闻
长按扫码 关注我们
原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/07/8424.html