MOLAR NEWS
2020年第19期
MolarData人工智能每周见闻分享,每周一更新。
全球最大的图像识别数据库ImageNet不行了?谷歌DeepMind新方法提升精度
将时间倒回15年前,2005年,还是一个被算法统治的年代。
刚刚拿到加州理工电子工程学博士学位,到伊利诺伊州香槟分校担任教职的李飞飞敏锐的发现了「算法为王」的局限性,开始研究算法的基石:数据集。 此后,全世界最大的图像识别数据集「ImageNet」诞生。ImageNet的出现,伴随着一个非常宏大的野心。完整版ImageNet拥有超过1400多万幅图片,涉及2万多个类别标注,超百万边界标注。2010年到2017年期间,围绕ImageNet共举办了8届 Large Scale Visual Recognition Challenge,包括图像分类,目标检测,目标定位单元。
2017年,挑战赛完结。八年来,参赛选手将算法正确识别率从71.8%提升到97.3%,这样的精度甚至已经将我们人类自己都远远的甩在后面。同时,也证明了数据集越大、效果越好。 近十年来,ImageNet一直是人工感知研究的核心测试平台,它的规模和难度凸显了机器学习领域的里程碑式成就。 但Google和DeepMind的科学家却认为,已有的ImageNet有些落伍了。他们发现,原始的ImageNet标签不再是新标注的最佳预测者,已经被最近的高绩效模型系统性地超越了。
ImageNet标签出了哪些问题?
每幅图像只有单一标签 现实世界中的图像通常包含很多标签,但是ImageNet对每幅图像只分配了一个标签,这就导致图像内容的严重表达不足。比如下图第一行,每幅图只标记了一个物体,图中很多物体都被遗漏了。
标签建议限制性过强 ImageNet注释流程是在互联网上查询制定类的图像,然后询问人工评审员该类是否确实存在于当前图像中。 虽然这个过程会产生合理的图像描述,但也会导致不准确的情况。当单独考虑时,一个特定的标签建议,看起来可能是对图像的合理描述;然而当与其他ImageNet类一起考虑时,这种描述马上就显得不那么合适了。 比如上图中间一行第二个更准确的标注应该是「水瓶」,然而从单张图片来看,你说它是水桶也说得过去。最后一个其实是「校车」,但校车上的人,不论是学生还是老师,也都是passenger呀。分类时的消歧义 例如最下一行中间,laptop的分类虽然是没错,但却忽略了notebook、Computor也同样可以指代同一个对象。如果我们能够将这些标签都用上,显然可以更精准的描述一个物体。
新方法如何改进ImageNet的缺陷
知道了症结所在,接下来就对症下药了。考虑到孤立地分配一个标签所产生的偏差,Google和DeepMind的研究团队设计了一个标签程序,它能捕获ImageNet数据集中内容的多样性和多重性。 并寻求一种范式,允许人类注释者同时评估一组不同的候选标签,又能保持proposal的数量足够小,以实现稳健的注释。
在模型子集上进行穷尽式搜索,以找到一组能达到最高精度,同时保持97%以上的召回率的模型子集。 在此基础上,科学家找到了一个6个模型的子集,它生成的标签proposal具有97.1%的召回率和28.3%的精度,将每个图像的平均proposal标签数从13个降低到7.4个。从这个子集中,使用上述相同的规则,为整个验证集生成proposal标签。 在获得了整个验证集的新的候选标签集后,首先评估哪些图像需要由人工进行评估。在所有模型都与原始ImageNet标签一致的情况下,就可以安全地保留原始标签而不需要人工重新评估,这样就将需要标注的图像数量就从50000张减少到24889张。 进一步根据WordNet的层次结构,将超过8个标签建议的图像分成多个标签任务。这就导致了37988个标签任务。 使用众包平台,将每个任务分配给5个独立的真人工标注者执行。
实验效果
下图是在ImageNet上,由Google和DeepMind科学家提出的sigmoid loss和clean label set的Top-1精度(百分比)。
可以看出,无论是sigmoid loss还是clean label set都比Benchmark优秀,而同时使用这两种方法获得了最好的性能。新方法在较长的训练计划下,其改进更为明显。 但是在存在噪声数据的情况下,较长的训练计划可能是有害的,科学加期望清洗 ImageNet 训练集(或使用 sigmoid 损失)能在这种情况下产生额外的好处。 在后续的实验中,科学家发现ReaL标签可以更正超过一半的ImageNet标签错误,这意味着ReaL标签提供了对模型准确性的更优越估计。
来源:Ofweek
无人驾驶新模范:AI 画地图无人车看
在自动驾驶中,无人车需要和传统地图大不相同的“高精度地图”。
供司机使用的传统地图,有导航、路径规划、拥堵提示的功能就足够了。但是在驾驶过程中,人脑能轻易完成的联想、识别、判断路况等工作,对于目前的无人车而言却非常困难。因此,供无人车使用的高精度地图就需要具备车道级的引导能力,帮助无人车“上道”。
高精度地图不仅需要描述出精细的车道标线、变道参考线以及弯道的起止位置等路面属性要素,还需要尽量完整还原道路现场情况,在三维空间里描述现实世界。一旦地图出现误差,或者更新不及时,就可能直接干扰无人车的行驶安全。
一直以来,为现实中存在的路段绘制高精度地图都是一个耗时耗力的工作,如何利用机器学习框架加速地图绘制,也成了无人驾驶公司角力的重头戏。利用机器学习开源框架 TensorFlow,数字地图提供商四维图新将高精度地图的人工率降低到了 30%,做到了从原始数据中自动识别地图要素,生成地图。
对于无人车来说,地图的精度越高、信息越丰富,就越容易判断路况,行驶也就越安全。高精度地图的精确主要体现在两个方面。
第一,绝对精度高。普通导航电子地图一般绝对精度在 5-10 米,只要起到辅助驾驶员的作用就足够了,但对于无人车来说,精确度就是生命线,两个车道间的距离也不过几十厘米。因此,高精度地图的绝对精度需要控制在 20 厘米以内,也就是一个车道标线的宽度,这样才能保证不会发生侧面碰撞。
第二,路面属性要素更丰富,更细致。在传统地图中,道路经常被抽象成宽度无差别的线,然而高精度地图不仅要有准确的定位坐标,还需要采集包括车道边界、交通标牌、护栏、路灯杆、龙门架在内的 100 多种路面属性要素,甚至每一条路路边马路牙的材质和宽窄,都要精确记录在地图中。当无人车上路时,高精度地图的每一个属性都关乎自动驾驶的安全:哪些路段周边有防护栏,哪些障碍物的材质偏软安全系数较高,都是行驶中做出判断的重要依据。
除了更精确以外,高精度地图的鲜度也更高。自动驾驶车辆需要实时掌握车辆周边设施的变化情况和道路的交通状态,因此,高精度地图需要提供日更新、甚至小时级更新的高鲜度数据和以分钟、秒为更新频率的动态交通信息。四维图新运用 TensorFlow 检测分割原始数据,大幅提高了地图数据生产的自动化率,保证了地图数据的鲜度。高精度地图的底图制作主要分为原始数据采集和地图要素提取两个步骤。
传统地图主要通过轻量级设备,采集车辆 GNSS 行驶轨迹数据,以及周边地物的 POI 点数据,而高精度地图需要更专业的采集车。四维图新的数据采集车上集成了激光雷达、惯性导航系统(INS)、全景相机、GNSS、差分基站等多种测绘工具,以绘制详细的车道级地面信息和道路周边详细的道路设施为主。
专业采集设备采集到的海量原始数据经过自动化解算后,TensorFlow 担纲的算法会自动从中提取出地图要素。在 AI 算法开发过程中,四维图新使用 TensorFlow 训练图像(对象检测、分割)以及点云识别算法,对点云自动进行要素分类。确定有价值的要素点云后,算法会滤除对后续提取有干扰的噪点,自动裁切作业范围外的无效点云。
滤除噪点后,算法通过点云分类结果和点云的强度值自动跟踪提取车道标线、路面标志、交通标志、护栏、路牙、杆状物、上方障碍物等路面、路侧、路上的交通设施和对自动驾驶有影响的附着物。提取的矢量数据根据识别结果自动赋属性值,和相邻的其他要素组织逻辑关系,车道之间的位置关系进行准确的定位和和规划,实现车道级别的规划。
在算法训练过程中,TensorFlow 支持大规模分布式模型训练,可以充分发挥硬件资源的集群优势。更多的硬件意味着更大的批次,进一步也决定了更快的训练效率和更好的算法效果。四维图新地图研发工程师郭兆钟告诉 PingWest品玩,使用 TensorFlow 后,同样规模的训练,训练时间缩短了40%。“在相同训练周期的情况下,算法模型的效果也有相当程度的提高。”郭兆钟说。在 TensorFlow 的帮助下,目前四维图新已经完成了全国高速,包括城市快速路的测绘工作,总地图里程达到 30 万公里以上。同时,四维图新高精度地图生产已经达到 40% 自动化率,30% 半自动化率,这一数据领先全行业。
来源:网易智联
现役韩国男团舞蹈整齐度哪家强?AI计算后说:SEVENTEEN
各类团综火爆今夏,青你、创造营 2020、乘风破浪的姐姐,还有刚开播的少年之名,都试图打造独一无二的男团女团。对于多人组成的团体而言,与个人 solo 不同,成员间的默契度尤为重要,体现在舞蹈上可能就是「齐」了。「刀群舞」成为团体舞蹈实力的高评价词汇(刀群舞指非常整齐的群体舞蹈,动作就像军刀划过一样干净利落不拖泥带水)。那么,在娱乐产业链发展较为完善、各种男团女团层出不穷的韩国,哪些团体的舞蹈最齐呢?最近,油管博主 techie_ray 利用机器学习和数学分析了多个韩国男团的舞蹈整齐度,包括防弹少年团(BTS)、EXO、SHINee、GOT7、NCT、SEVENTEEN、MONSTA X 等,成为人们热议的话题。
techie_ray 强调这一分析没有偏见,仅使用纯数学方式进行评估,评估结果仅基于计算机的严格计算。那么,对舞蹈整齐度的分析是如何实现的呢?techie_ray 在视频中介绍了具体步骤:
1.找到干净的舞蹈样本
想要做横向对比,首先得有干净的数据。由于此次分析涉及舞蹈整齐度,因此 techie_ray 希望的样本是团体中所有个人舞蹈动作一样,没有单人 part,以便对团体中每个人的舞蹈动作进行公平的相似度分析。此外,由于博主自己设计的 app 无法检测被其他团员遮挡的个人,因此舞蹈样本视频需要团体中的每个人相对散开,即尽量不要出现遮挡。techie_ray 将每个团队的三四个样本合成一个视频。
2. 将视频上传到 app
接下来,将上述样本视频上传到博主自己开发的 app 中,令 app 执行相应的计算。在今年 3 月份发布的另一则视频中,techie_ray 介绍了他利用人体姿态估计算法设计了一款用来评估舞蹈质量的 app。他的设计初衷是对比原始视频和输入视频的相似度,比如原版视频和自己的舞蹈视频,进而确认自己的舞蹈实力和进步方向。具体而言,他使用 TensorFlow 框架下实现的姿态估计算法 Openpose,进行人体关键点检测。如果你想要自己运行一遍,需要安装好 Python 3、TensorFlow 1.41 以上版本,以及 opencv3 等库。
然后,利用梯度来计算舞蹈动作之间的相似度。
3. 评测男团舞时,app 后端发生了什么
在评测男团舞整齐度的场景下,这款 app 将舞蹈视频分解为多个帧,并分析每一帧中每个成员的舞蹈相似度。
4. 计算所有视频帧的平均整齐度
最后,这款 app 会计算舞蹈的整齐度。整齐度得分区间为 0%-100%,得分越高表示舞蹈整齐度越高。我们来看看该分析中目前得分最高的男团是谁。
是 SEVENTEEN!这支 13 人男团以 95.77% 的整齐度分数在该分析中名列第一,无怪乎有微博网友表示:
那么,在 techie_ray 的分析中,其他男团的舞蹈整齐度如何呢?我们来看一下:
·SEVENTEEN 95.77%
·TXT 组合 93.00%
·straykids 92.71%
·NCT127 91.98%
·NCT_DREAM 91.47%
·MonstaX 90.36%
·GOT7 89.49%
·SHINee 89.34%
·防弹少年团(BTS) 87.77%
·EXO 86.19%
·WayV 85.53%
全球流行,火出 k-pop 圈的防弹少年团,在这里看来并不以舞步整齐度见长?不知和你的印象有没有不同?不过同步程度只是流行舞蹈评价的一个方面。舞蹈评价是较为主观的,想要让人工智能给男团打分,还有很多其他方面需要考虑。在这个项目之后,作者 techie_ray 表示下一个视频将会制作女团版本。
来源:机器之心
上海智能网联汽车规模化示范应用启动,滴滴上线自动驾驶服务
6月27日,上海智能网联汽车规模化载人示范应用启动,滴滴出行首次面向公众开放自动驾驶服务。用户可通过滴滴APP线上报名,审核通过后,将能在上海自动驾驶测试路段,免费呼叫自动驾驶车辆进行试乘体验。
现阶段,滴滴自动驾驶载人测试范围仅限于在上海开放测试道路上,路线经过汽车会展中心、办公区、地铁站、酒店等核心区域。用户通过滴滴APP在开放道路范围内选择起终点,可免费体验自动驾驶服务。
为确保行程安全,自动驾驶测试车依相关规定配备了安全员,可随时接管车辆,应对突发情况。与此同时,滴滴设立了国内首个自动驾驶安全护航中心,能实时监控车辆、路况,并在车辆面临复杂情况时,给与协助指令,解决未来自动驾驶运营中可能出现的远程协助问题。
在测试区域的部分路口,滴滴部署了自主研发的车路协同解决方案,能将道路信息实时共享给区域内不同公司的自动驾驶测试车,消除行驶盲区。
滴滴出行CTO兼自动驾驶公司CEO张博表示,“滴滴通过给驾驶员和自动驾驶车辆混合派单的方式,弥补自动驾驶车辆仅能在特定区域使用的局限,让现阶段自动驾驶不仅仅停留一种新奇的体验,更能成为人们日常出行的切实补充。”
滴滴出行创始人兼CEO程维表示,“我们相信最终AI技术会大幅提升驾驶安全和效率,造福人类,而滴滴最大优势是场景和数据以及坚定投入的决心。同时我们也相信自动驾驶从技术成熟,商业成熟到法规成熟,道阻且长,至少还需要做十年持续投入的计划,也要做好面对各种困难和挑战的准备,但方向是明确而坚定的。”程维认为,“司机有温度的服务不会因新技术出现而消失,自动驾驶也会给网约车司机创造新的职业和岗位。”
滴滴自2016年开始组建自动驾驶研发团队,目前中美两地已有近400人的团队。截至目前,滴滴已获得北京、上海、苏州、美国加州等地路测资格,并在去年9月获得上海颁发的首批载人示范应用牌照。
来源:猎云网
三星运用无人机和AI来维护5G基站 可大量节省维护时间
据外媒SAMMOBILE消息,三星近日展示了一种使用无人机和AI维护5G基站的方法。
三星近日在其某个园区中成功展示了基于无人机的新型天线配置机制。该解决方案将为网络运营商提供一种更轻松的方式来管理小区站点,优化网络性能并提高员工安全性。
在新的解决方案中,网络工程师可以留在地面上,并使用智能手机操作配备摄像头的无人机,以捕获4G或5G天线的图像和视频。这种天线通常安装在高层建筑的塔或屋顶上。视频数据可在几秒钟内被发送到云服务器,通过深度学习可验证天线的方位角、旋转和倾斜程度,以检查天线是否在正确的位置。
在三星的演示中,工程师用了不到一分钟的时间将天线的可视数据传输到云端,并在智能手机屏幕上实时查看结果。整个过程,包括操作无人机、获得视频数据、处理数据和调整天线,可以在十五分钟的时间内完成。相比之下,攀登手机信号塔并手动执行所有任务可能要花费几个小时,且该过程还不安全。三星还计划在此之上增加更多技术,例如允许工程师使用PC或智能手机远程调整天线角度,以实现最佳位置和更高性能。
来源:CNMO
AI资讯
掌握最新时事新闻
长按扫码关注我们

原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2020/06/8514.html