急性白血病

首页 » 常识 » 预防 » 让AI学会ldquo群体技rdqu
TUhjnbcbe - 2021/8/7 2:39:00

一种全新的大数据协同分析技术。

图片来源:Pixabay

来源DZNE-GERMANCENTERFORNEURODEGENERATIVEDISEASES

翻译顾晨月

编辑魏潇

团体得益于成员之间知识和经验的交流。一个国际研究小组遵循一个与此类似的原则,用“群体学习(SwarmLearning)”的模式训练人工智能算法,在以去中心化方式储存的数据中检测血癌、肺部疾病和新冠肺炎(COVID-19)。由于能够提供隐私保护技术,这一方法相比于传统方法更具优势,且有助于科学数据的跨站点分析。因此,“群体学习”能够极大促进和加速研究领域的合作与信息交流,在医学领域中尤其明显。来自德国神经退行性疾病研究中心(GermanCenterforNeurodegenerativeDiseases,DZNE)、德国波恩大学(UniversityofBonn)、美国信息技术公司惠普企业服务HewlettPackardEnterprise(HewlettPackardEnterprise,HPE),和其他研究机构的专家在科学期刊《自然》(Nature)对此进行了报告。

科学和医学越来越数字化。分析大量该领域的信息——也就是我们所熟知的“大数据”——是找到更好的医疗方案的关键。DZNE系统医学(SystemsMedicine)的主任,波恩大学生命与医学科学研究所(LifeMedicalSciencesInstitute,LIMES)的教授JoachimSchultze说:“医学研究的数据是一个宝库,它在个性化医疗手段的开发中起决定性作用。相比于传统的治疗手段,(个性化医疗手段)对个人更具针对性。而能够从更多的资料来源中尽可能全面地获取并运用这些数据,对科学研究而言是至关重要的。”

然而,跨地点或者跨国家的医学研究数据交换受到数据保护和数据主权条例的限制。事实上,这一需求需要大量的努力来实现。此外技术壁垒也是一个问题。比如,对大量数据进行数字传输时,数据线会很快达到其性能极限。正因为这些原因,许多的医学研究都局限于本地,而无法使用其他位置的数据。

将数据储存在原处

考虑到这一点,在一项由JoachimSchultze领导的研究中,研究者们测试了一种全新的,用于评估以去中心化方式储存的研究数据的方法。这一方法以HPE公司开发的“群体学习”技术为基础。除了互联网技术公司之外,希腊、荷兰、德国的众多研究机构也同样参与了这项研究,其中包括德国新冠肺炎组学倡议联盟(GermanCOVID-19OMICSInitiative,DeCOI)。

“群体学习“结合了一种特殊的、在网络节点间进行信息交换的方式,而这种方式是通过“机器学习”这一人工智能分支实现的。机器学习的关键在于其算法,它利用数据进行训练,由此学习其中的特征,从而获得在其他数据中识别已习得的特征的能力。HPE高级副总裁兼人工智能首席技术官EngLimGoh博士说:“群体学习为医学研究和商业合作提供了新的机会。”

事实上,通过“群体学习”,所有数据还是储存在原处,只有算法和参数是共享的。以这一方式,也能获得(医疗案例的)经验。JoachimSchultze强调:“群体学习以一种自然而然的方式满足了数据保护这一要求。”

协同学习

科学家波恩解释说,与同样将数据储存在原处的“联邦学习(federatedlearning)”不同,“群体学习”中不存在集中化的控制中心。“‘群体学习’是一种建立在所有合作者事先商定的规则上的合作方式。这些规则被储存在一个区块链上。”这是一种以绑定方式管理合作成员间信息交换的数字协议,它记录下所有的事件,以及所有访问过它的成员。Schultze说:“区块链是‘群体学习’的支柱,所有该群体中的成员拥有相同的权力,没有中心化的力量去控制事件的发生及结果。所以,从某种意义上说,没有网络爬虫(spider)控制数据网络。”[译注:网络“爬虫(Spider)”,或称“机器人(Robot)”,是指能够在万维网上漫游,自动获取链接文档的程序,因其在万维网上爬行的行为而得名。]

因此,这种人工智能算法能在本地,也就是在各个网络节点可访问的数据的基础上进行学习。每个节点的学习结果将通过区块链以参数的形式被收集,并通过系统进行智能处理。这些结果,也就是优化后的参数,将被传递给所有成员。这个过程重复多次后,各个网络节点识别数据特征的算法能力都将逐渐提高。

肺部图像和分子特征

研究人员现在通过分析肺部X光片及相关转录组数据,证实了该方法的可行性。目前的研究中,研究者们重点

1
查看完整版本: 让AI学会ldquo群体技rdqu