
MOLAR FRESH 2021年第18期
人工智能新鲜趣闻 每周一更新
Nat. Biomed. Eng.| AI医疗影像诊断: 慢性肾病和2型糖尿病检测及发病预测
四川大学华西医院、澳科大医学院的张康教授主导,与多个机构合作,使用深度学习模型仅根据视网膜眼底图像或与临床元数据(年龄、性别、身高等)相结合来识别慢性肾病(CKD)和2型糖尿病(T2DM),并预测疾病发展风险对患者进行分级。研究结果发表于nature biomedical engineering。

作者开发了一种能够分析视网膜眼底图像以检测CKD和T2DM的AI系统,实现两类任务:
(1)预测连续值(包括肾脏功能指数eGFR)的回归任务;(2)进行诊断的二元分类任务。此外,系统可以预测疾病的发展,并在两个纵向群组中验证了对CKD和T2DM进行风险分级,在移动设备拍摄的视网膜眼底图像数据集上也进行了验证。
除了预测当前CKD状态,作者还使用纵向组数据集预测个体发展为CKD/advanced CKD的风险,结果表明眼底图像和临床元数据结合的发展预测模型在统计学上有明显的改进。
模型不仅适用于使用专业相机获得的临床级视网膜图像,也适用于使用智能手机拍摄的眼底图像。这些结果提高了基于AI检测其他具有视网膜表现的系统性疾病的可能性,超出了临床医生的观察能力,与传统的疾病筛查方案相比,也将带来巨大的成本节约。
(来源:DrugAI)
准确率87.5%,微软、中科大提出十字形注意力的CSWin Transformer
微软、中科大提出十字形状的自注意力机制,能够在水平和垂直两个方向上同时计算注意力权重。这项工作的出发点是为了解决Self-Attention(SA)的问题。在没有额外数据预训练的情况,CSWin-B能达到85.4%的top-1准确率,用ImageNet-21K预训练时,能够达到87.5%的top-1准确率。
作者还引入了一个能够适应不同大小输入特征的相对位置编码,用卷积来加强局部偏置,并直接加到SA的结果后面,来减少计算量。

本文的模型结构如上图所示。相比于其他ViT结构,CSwin Transformer主要有两点不同:1)将SA替换成了SCWin Self-Attention;2)提出了一个新的位置编码算法,引入局部假设偏置,并能够和SA模块并行计算。CSWin Transformer block的结构和其它ViT的结构都非常相似,不同的只是加了局部增强的位置编码,将注意力机制换成了十字形状的Self-Attention。
在COCO数据下,使用Mask R-CNN的框架,CSWin的能够取得不错的效果。使用CascadeMask R-CNN的框架,CSWin依旧能够超过SWin-T和ResNeXt。在语义分割任务上,该模型也能比Swin-Transformer高出比较多的性能。
(来源:极市平台)
革新Transformer!清华大学提出全新Autoformer骨干网络,长时序预测达到SOTA
尽可能延长预测时效是时序预测的核心难题,对于能源、交通、经济的长期规划,气象灾害、疾病的早期预警等具有重要意义。近日,清华大学软件学院机器学习实验室,基于随机过程经典理论,打破Transformer原有架构,得到Autoformer模型:
深度分解架构:突破将时序分解作为预处理的传统方法,设计序列分解单元以嵌入深度模型,实现渐进式地预测,逐步得到可预测性更强的组分。
自相关(Auto-Correlation)机制:基于随机过程理论,丢弃点向连接的自注意力机制,实现序列级连接的自相关机制,且具有的复杂度,打破信息利用瓶颈。

时间序列分解是时序分析的经典方法。作者提出深度分解架构,在预测过程中,逐步从隐变量中分离趋势项与周期项,实现渐进式分解。并且模型交替进行预测结果优化和序列分解,可以实现两者的相互促进。
作者在6个数据集上进行了测试,涵盖能源、交通、经济、气象、疾病五大主流领域。Autoformer在MSE指标上平均提升38%。将提出的深度分解架构应用于其他基于Transformer的模型,均可以得到明显提升,验证了架构的通用性。同时随着预测时效的延长,提升效果更加明显,这也印证了复杂时间模式是长期预测的核心问题。模型具有良好的效果鲁棒性,具有很强的应用落地价值。
(来源:新智元)
Nature封面:乘着AI的翅膀,数据「带飞」计算社会科学!
计算机大大加快了数据分析的速度,被广泛应用在审计和人口普查上。 而这种将大量数据分析与社会问题相结合的工作,即计算社会科学(Computational social science)近年来得到了巨大的发展。Nature就以特刊形式讨论了目前计算社会科学面临的挑战和机遇。

开展跨学科研究时,科学家们首先需要学会彼此的语言,然后得出一种能够相互理解的术语。计算社会科学的学科互补特性,能更高效地回答研究问题。
社会科学理论需要更新,承认算法带来的影响;要是没有这些理论,没有清晰理解算法对可用数据的影响,研究人员就无法得出有意义的结论。
一篇关于「人类社会感知」的文章对于如何获得有用、可靠的数据列举了一些方法。这是对个人如何在其社交网络中收集他人信息的研究。要建立准确的传染和感染模型,研究人员需要了解患病人群的文化和行为。如果不考虑传播的这些和其他社会方面的传播因素,就难以预测疾病的传播路径。跨学科的结构和广泛合作十分关键。
而新冠肺炎疫情已经表明,大规模数据集应用于科学能够挽救生命。随着具有计算机科学或应用数学背景的研究人员与社会科学家的合作,而这种潜力才刚刚开始显现。
(来源:新智元)
CVPR 2021 最佳论文奖:GIRAFFE,一种可控图像合成方法
CVPR 2021 年度最佳论文奖,颁发给了来自德国马克斯 – 普朗克研究所的 Michael Niemeyer 和蒂宾根大学的 Andreas Geiger。
这篇名为 “GIRAFFE: representation Scenes as composition Generative Neural Feature Fields” 的论文,提出了一个基于学习的、完全可微的渲染引擎 GIRAFFE,可以用于将场景合成为多个 “特征域” 的综合,完成可控图像的合成任务。

该任务着眼于生成新的图像并控制将要出现的内容、对象及其位置和方向、背景等等。使用改进的 GAN 架构,他们甚至可以在不影响背景或其他对象的情况下移动图像中的对象。
传统的 GANs 架构使用下图的编码器和解码器设置。而该团队在训练数据集中将所有的图像重复多次,以便编码器和解码器学习如何在训练阶段最大化所要实现任务的结果。
本文提供了一种模块化的框架,以完全可微且可学习的方式从对象中构建和组成 3D 场景。这种将图像视为由生成的体渲染图组成的场景的方式允许它们在生成的图像中改变摄像机位,并独立地控制对象。GIRAFFE 堪称是对近期 NERF 和 GANs 相关领域的一个令人兴奋的研究。
(来源:数据实战派)
END

掌握AI咨询
了解更多科技趣闻
原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2021/07/8426.html