MolarData| AI领域资讯速递


MOLAR NEWS

2020年第51期  


MolarData人工智能每周见闻分享,每周一更新。

AAAI 2021 | 清华提出深度对齐聚类用于新意图发现

近日,清华大学智能信息处理实验室的一篇论文被人工智能顶级会议AAAI 2021(CCF A类)接收,标题为《Discovering New Intents with Deep Aligned Clustering》。

用户每句话对应一个意图标签,包括已知意图和新意图。在实际情况中,往往没有任何关于新意图的先验知识(即有标签样本),甚至由于标注成本等问题,关于已知意图的先验知识也比较有限,这个任务也被称为新意图发现问题。如图所示,训练集同时包含已知意图和新意图样本,但是只有少量(10%)有标注已知意图样本。我们的目标是利用少量有标注数据作为先验知识,指导识别已知意图并发现新意图。

MolarData| AI领域资讯速递

DeepAligned算法成功地借助少量已知意图先验进行知识迁移,通过深度对齐聚类学习高质量意图特征表示用于新意图发现。该方法能利用少量有标注意图样本预测新意图数量,通过对齐策略提供一致性伪标签作为自监督信号用于表示学习。我们在两个基准数据集进行实验,DeepAligned在不同已知意图和簇数量设置下,相较于现有方法取得了显著提升。

源:AI科技评论



机器学习与流体动力学:谷歌AI利用「ML+TPU」实现流体模拟数量级加速

最近,来自谷歌 AI 的研究人员利用端到端深度学习改进计算流体动力学(CFD)中的近似,以建模二维涡流。对于湍流的直接数值模拟(direct numerical simulation, DNS)和大涡模拟(large eddy simulation, LES),该方法获得的准确率与基线求解器相同,而后者在每个空间维度的分辨率是前者的 8-10 倍,因而该方法实现了 40-80 倍的计算加速。在较长模拟中,该方法仍能保持稳定,并泛化至训练所用流以外的力函数(forcing function)和雷诺数,这与黑箱机器学习方法正相反。此外,该方法还具备通用性,可用于任意非线性偏微分方程。

MolarData| AI领域资讯速递

该算法的工作流程如下:在每一个时间步中,神经网络在每个网格位置基于速度场生成隐向量,然后求解器的子组件使用该向量处理局部解结构。该神经网络为卷积网络,具备平移不变性,因而允许解结构在空间中是局部的。之后,使用标准数值方法的组件执行纳维 – 斯托克斯方程对应的归纳偏置,如图 1c 灰色框所示:对流通量(convective flux)模型改进离散对流算子的近似;散度算子(divergence operator)基于有限体积法执行局部动量守恒;压力投影(pressure projection)实现不可压缩性,显式时间步算子(explicit time step operator)使动态具备时间连续性,并允许额外时变力的插值。「在更粗糙网格上的 DNS」将传统 DNS 和 LES 建模的界限模糊化,从而得到多种数据驱动方法。

源:机器之心



欲用AI大规模生产诱导多能干细胞,这家初创公司获1600万美元融资

Nabiha Saklayen 在读博期间发明了基于激光的递送技术,她对其技术进行了解释,「在液态环境中将激光脉冲光照射到纳米表面上时,会产生蒸气气泡。气泡打开了细胞中的瞬时孔,使物质扩散到细胞中。在某些情况下,气泡大小取决于激光参数,较大的气泡会杀死不需要的细胞。通过激光介导的靶向递送,可以获得特定的细胞。

MolarData| AI领域资讯速递

Khosla Ventures 合伙人 Alex Morgan 博士说「通过使用单细胞激光加工和 AI 引导的自动化技术大规模地改造细胞,Cellino 在领导下一代个性化再生药物方面处于有利位置。

来源:机器之心

AI智能体学会动物进化法则:李飞飞等提出深度进化RL

近日,来自斯坦福大学的研究者 Agrim Gupta、Silvio Savarese、Surya Ganguli 和李飞飞提出了一种新型计算框架——深度进化强化学习 (Deep Evolutionary Reinforcement Learning, DERL),该框架能够在环境、形态和控制这三种复杂度维度下同时规模化创建具身智能体。DERL 框架如下图 1 所示

MolarData| AI领域资讯速递

DERL 为在计算机模拟实验执行大规模具身智能体创建活动打开了大门,这有助于获得对学习和进化如何协作构建环境复杂度、形态智能和控制任务易学性之间复杂关系的科学洞见。此外,DERL 还缓解了强化学习的样本低效性,创建具身智能体不仅可以使用较少的数据,还能够泛化解决多种新任务。DERL 通过模仿达尔文进化论中错综复杂的跨代进化过程来搜索形态空间,通过终身神经学习来评估给定形态通过智能控制解决复杂任务的速度和质量。

来源:机器之心



1.9万亿参数量,快手落地业界首个万亿参数推荐精排模型

据快手推荐算法负责人,曾在 Google Research 担任 Staff Research Manager 的宋洋博士介绍,短视频行业有其独特的挑战,表现在用户量多,视频上传量大,作品生命周期短,用户兴趣变化快等多个方面。因此短视频推荐很难照搬传统视频行业精细化运营的做法,而需要依靠推荐算法对视频进行及时、精确的分发。快手推荐算法团队一直针对短视频业务进行深度定制和积极创新,提出了很多业界首创的推荐模型和想法,同时也给推荐工程架构团队带来了很多系统和硬件层面的挑战。

MolarData| AI领域资讯速递宋洋博士认为,快手精排万亿参数模型是推荐系统一个里程碑式的突破,它结合了序列模型,长短期兴趣模型,门控模型,专家模型等各个方面的优点,是至今为止工业界最全面,最有效的推荐模型之一。该模型已在快手的主要业务上全量上线为用户服务。在未来「算法 – 系统 – 硬件」三位一体的挑战和机遇可能会有更多,希望这将更进一步推动快手推荐系统在技术上的创新和突破,为用户增进体验和创造价值。

来源:机器之心



AI资讯

掌握最新时事新闻

长按扫码关注我们

MolarData| AI领域资讯速递

原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/02/8461.html

Like (0)
Previous 2021-02-05 12:23
Next 2021-02-12 16:26

相关推荐