MolarData| AI领域资讯速递


MOLAR NEWS

2020年第23期  


MolarData人工智能每周见闻分享,每周一更新。

“会说话”的手!这个手套可以翻译手语,还能通过APP转换语音

MolarData| AI领域资讯速递

经过半个多月的艰难防疫,北京的疫情逐渐得到初步控制。

对于现在不少年轻人来说,在手机上观看短视频或在通勤路上收听广播是他们主要的消息来源,但是对于听障人士来说,这也在无形之中阻断了他们获取最新消息的途径。

此前,根据《新京报》报道,在北京市新型冠状病毒肺炎疫情防控工作新闻发布会上,有一只专门的手语翻译队伍,他们坐在发布台旁,手指上下翻飞,迅速将发布内容用“手势”表达出来。据了解,这支队伍已经帮助了北京22.7万名聋人了解疫情防控信息。

MolarData| AI领域资讯速递

是否能够从技术上帮助这些手语翻译者们,这可能是技术从业者们还有待开发的领域。

最近,加州大学洛杉矶分校UCLA的工程师开发出一款手语翻译手套,只要戴上手套,通过动作侦测,系统就能得出手语的意思,还可以通过和手机APP连接,直接发出声音,对于有口语障碍者来说也有着极为丰富的运用场景。这款手套内嵌有纤细的可伸展传感器,连接在指尖位置,这些传感器能够通过导电纤维收集手指的动作和位置信息,手套主要利用位于手腕处的一小块硬币大小的电路板供电。

MolarData| AI领域资讯速递

当你戴上手套做出手语时,手套能够将字母、数字、单词和短语组合翻译成口语单词。

不仅如此,在脸部、眉毛间、以及嘴巴侧面可以添加额外的传感器,用以捕获面部表情。

要实现语音翻译,还需要和手机上的应用程序联动使用,该应用程序使用经典机器学习算法将手势转换为字母,数字和单词,在速度上,该手套每秒就能翻译一个单词,还处于比较初级的阶段。

MolarData| AI领域资讯速递

该系统能识别660个符号,包括字母表中的每个字母以及从0到9的数字。

目前,加州大学洛杉矶分校(UCLA)已为该手套申请了专利。

手套的好处在于它的便携和轻巧,这种新手套的重量比普通手套还要轻,这就为在手套上安装可穿戴设备提供了支持。

设计该手套的首席研究员Jun Chen说:“我们希望这个手套能为使用手语的人提供简便的沟通方法,使他们可以直接与非手语使用者进行交流,而无需其他人为其翻译。”

“我们也希望这个手套可以帮助更多的人学习手语。”不过,这个手套也遭到了一些聋哑研究人员的批判。伦敦大学学院认知与语言研究中心聋哑人研究人员Gabrielle Hodge表示,这项技术是多余的,现在聋哑人已经可以在手机上广泛使用文本语音实时软件或文本翻译软件,或者用笔和纸书写,甚至单纯地做手势就能与人交流。

“如果技术首先专注于用户驱动和以用户为中心的设计,那将比想像这些技术人员认为能够解决世界上所有问题的’解决方案’还要容易得多。”

来源:网易智联

算法战争:美国国家AI安全委员会要建立AI大学,「数字服务学院」为政府培养AI人才

中国在经济与军事方面的崛起,以及AI更多地渗入商业与政府。在时代引发的担忧下,美国国会于2018年成立美国国家AI安全委员会(NSCAI),旨在为涉及国防、研究投资和战略规划的国家AI战略提供咨询。

MolarData| AI领域资讯速递

委员会成员多为科技高管,包括亚马逊云服务首席执行官Andy Jassy、谷歌云计算首席AI科学家Andrew Moore和微软首席科学家Eric Horvitz等。谷歌前首席执行官埃里克·施密特(Eric Schmidt)担任董事长。

该小组的建议可能会对美国政府和世界产生长期影响。

本周,NSCAI就如何美国维持AI霸权提供了35条建议。下周,科技公司的CEO们或将前往华盛顿参加反垄断听证会。

MolarData| AI领域资讯速递

委员们建议创建一所认可的大学,称为美国数字服务学院,免费培养AI人才,毕业生需在政府工作5年来支付学费。学院的课程将包括美国历史、数学以及计算机科学。学生可以参加政府机构和私营部门的实习。

MolarData| AI领域资讯速递

另外,建议还包括建立以军事后备队为模型的国家后备军。AI人才们可以兼职为政府做出贡献。但与要求技术人员服务一年的美国数字服务不同,NRDC只要求每年工作至少38天。 鼓励竞争,但必须考虑国家安全国际关系,即美国如何与盟国合作以及如何对待对手,是委员会一个重要议题。 「我们希望现在提出的建议能成为国际对话的基础,不仅是在合作领域内,甚至还能与潜在的对手进行合作。」埃里克·施密特说。 建议还包括: 对美国国务院工作人员进行AI等新兴技术培训。 鼓励国防部在机器人过程自动化等方面采用商用AI系统。 为美国军方建立一个认证的AI软件库,以加速AI的创建并支持研究和开发。 建立一个数据库,以跟踪美国军方的研究和发展项目。 军方领导人是否能采纳国防部的开放创新模式,以加速五角大楼创造AI的能力。将AI应用集成到「所有主要的联合和服役演习」,以及战争演习和桌面演习中。 投资于测试AI系统的研究和开发,以确保遵从性和验证结果。

MolarData| AI领域资讯速递

虽然许多委员在会议上强调了捍卫人工智能在其他民族国家的霸权的必要性,但微软的Horvitz表示,「说实话,我们最大的竞争对手是现状和创新。」 去年秋天,NSCAI就如何保持国家在AI方面的优势向国家领导人提供建议。包括建立公私合作关系和政府资助半导体发展,以及使用ASVAB军事入学考试来识别具有「计算思维」的新兵。NSCAI专员、中情局投资部门In-Q-Tel创始人Gilman Louie表示,他欢迎AI在探索、科学、健康和环境方面的健康竞争,但最好事关国家安全,特别是在对抗性机器学习等领域。 今年2月一份来自斯坦福大学和纽约大学的联合报告也显示,在美国,只有一小部分联邦机构使用复杂形式的机器学习,而用于算法治理的系统可信度对于公民信任至关重要。  

MolarData| AI领域资讯速递

委员会还讨论了今后可能采取的步骤,如测试和验证框架建议以及将伦理原则付诸实践的方法,其他建议将在秋季公布。 NSCAI是一个临时组织,定于明年春天向国会提交最终报告,并将于2021年10月解散。

来源:新智元

3D特效师可以下班了丨Science

是否还记得前阵子爆火的SM娱乐公司电子屏海浪?

MolarData| AI领域资讯速递

人工制作那样的特效,可能需要花费……嗯,毕竟被称为「每滴水都是粉丝贡献的钱」。

但现在,DeepMind和斯坦福等一众科学家研究出了一款图网络模拟器——GNS框架,AI只需要“看着”场景中的流体,就能将它模拟出来。

无论是流体、刚性固体还是可变形材料,GNS都能模拟的惟妙惟肖。研究人员还称:

GNS框架是迄今为止最精确的通用学习物理模拟器。

并且,这项研究最近还被顶刊 Science 收录。

MolarData| AI领域资讯速递

这也不禁让人联想起,清华姚班毕业生胡渊鸣开发的太极 (Taichi),不仅大幅降低了CG特效门槛,效果还十分逼真

而在 DeepMind 和斯坦福大学的这项工作中,胡渊鸣的太极,依然发挥了作用。

他们正是利用胡同学的太极,来生成2D和3D的挑战场景,作为基线效果之一。

效果好到什么程度?Science在社交网络评价说:

MolarData| AI领域资讯速递

「好莱坞或许会投资这款模拟器吧」。

我们人类通过「经验」,说到一个场景时,能很快脑补出那种动态画面。

那么AI「脑补」出来的画面效果,是否和你想象的一样呢?

首先,是水落入玻璃容器中的3D效果。

MolarData| AI领域资讯速递

和我们想象中的物理效果一模一样,有木有!

左侧的基线方法叫做SPH (smoothed particle hydrodynamics),这是1992年提出的一种基于颗粒的模拟流体的方法。

而右侧,AI通过「看」而预测得到的结果,就是研究人员提出来的GNS方法。

来看下二者在慢动作下的细节差异。

MolarData| AI领域资讯速递

不难看出,GNS方法在细节处理上,例如溅起的水花,更加细粒度,也更逼近我们印象中的样子。

当然,GNS不仅能够处理液体,还能够模拟其他状态的物体。

例如,颗粒状的沙子。

MolarData| AI领域资讯速递

还有粘性的物体。

上面两个效果中的基线方法是MPM (material point method),1995年提出,适用于相互作用的可变形材料。

同样,在颗粒散落在玻璃容器壁上的细节上,GNS的预测结果更加符合现实物理世界的效果。

GNS模拟物体最根本的原理,是将一块体积不变的物体模型X,分散成许多颗粒,并通过一个模拟器sθ,转变成它受到撞击后的形态。

从下图可见,模拟器sθ的用处,是将这块流体输入到一个动力学模型dθ中,并将产生的一帧帧结果用于更新物体变形的过程。

MolarData| AI领域资讯速递只要模拟器更新的时间够快,我们看见的就是这块物体在玻璃盒中受到撞击、不断变形的样子。

MolarData| AI领域资讯速递

关键来了,动力学模型dθ要怎么实现?

团队采用了“三步走”的方法,将模型分为编码器、处理器和解码器三部分。

MolarData| AI领域资讯速递

一块物体经过编码器后,编码器会将物体中原本分散的各颗粒架构起来,组成一个“看不见的”图。

MolarData| AI领域资讯速递

而在处理器中,图中各颗粒的关系会不断发生变化,图网络学习得到的传递信息将会在图上迭代M次。

MolarData| AI领域资讯速递

最后,解码器会将迭代好的动力学信息Y,从最后一次迭代出的图中提取出来。

MolarData| AI领域资讯速递

反馈回物体X上后,物体中的颗粒便能进行一帧帧改变,连续起来就是模拟出的液体形态。

MolarData| AI领域资讯速递

可以看见,无论是哪种物体形态,GNS预测的效果都与真值非常相近。

与之前一些模拟液体的神经网络相比,GNS最大的改进在于,它将不同的物体类型,转变成了输入向量的一个特征。

只需要将不同的物体类型(例如沙子、水、胶质物等)用不同特征区分,就能表现出它们的状态。

相比之下,此前一个名为DLP的、基于神经网络的液体模拟器,与GNS相比就过于复杂。

同样是模拟各种流体模型,DLP则需要不断地保存颗粒之间的相对位移,甚至需要修改模型来满足不同的流体类型——所需要的运算量过于庞大。

不仅如此,GNS的模拟效果竟然还比基于DLP的模拟器更好。

来源:量子位


ICSE 2020获奖论文:ANU陈洁珊等人提出LabelDroid,帮助视障群体打开智能新「视」界

近日,来自澳大利亚国立大学等机构研究者,提出了一种名为 LabelDroid 的方法,帮助视障人士更轻松地使用智能手机。目前,该论文已获得了第四十二届国际软件工程大会 ICSE 2020 的 ACM SIGSOFT 杰出论文奖。

MolarData| AI领域资讯速递

本文将介绍一篇论文《Unblind Your Apps: Predicting Natural-Language Labels for Mobile GUI Components by Deep Learning》将为这个难题提供一份新的解决方案。

MolarData| AI领域资讯速递

论文从 Google Play 中爬取了 10,408 个安卓软件来研究当今手机软件的 Accessibility 情况。对于每个 App,论文使用自动工具探索并收集了软件中的 UI 截图跟对应的运行时的 xml 代码文件。这个代码文件包含了研究所需的信息,即每个 UI 内的所有部件的位置、类型和描述字段。表格 1 展示了现有的描述字段缺失的统计数据。出人意料的是,研究结果表明有超过 77% 的 App 存在 Accessibility 问题(即至少有一个图形按钮缺乏描述字段)。具体来说,更是有超过 60% 的 UI 存在问题。想象一下,当我们使用手机的时候,平均两个界面就有一个界面存在至少一个我们不知道其功能的按钮,这十分影响用户体验。

MolarData| AI领域资讯速递

接下来,论文进一步探索了不同类别软件中,软件缺失情况的分布。如图 4 所示,确实对于一些类别,超过 70% 的软件都存在十分严重的缺失问题,至少有 80% 的非文字按钮都没有描述字段。其他类别软件的情况相对较好,但也仍有 30% 的软件基本无法使用。

MolarData| AI领域资讯速递

Previous 2020-07-20
Next 2020-08-03

相关推荐