作者:蔺亚妮闫麒*先琪马婧婷汝昆
“人工智能”(artificialintelligence,AI)概念于年首次被提出,在历经最初的兴起及短暂的繁荣之后,进入低靡发展期。近年来,随着大数据、互联网、算法等技术的进步,人工智能再次迎来新一轮的高潮,并以前所未有的速度渗透到医学行业的各个领域,尤其是辅助诊断方面,AI也将会给传统的疾病诊断模式带来变革。
血液系统疾病是一类高度异质性的疾病,其诊断需要在临床表现的基础上,结合形态学、流式细胞学、遗传学和分子生物学的结果进行综合分析。
一、AI在血液系统疾病诊断中的应用
(一)AI在形态学诊断的应用形态学检查是血液系统疾病诊断和分型的基石。目前该检查还要依赖于病理医生在显微镜下肉眼进行识别,耗时长、缺乏客观性、无法准确定量,因此要求病理医生具有丰富的经验,是学科发展的主要制约因素。另一方面,形态学检查基于图像信息的特点,又使其成为AI应用的重要方向。事实上,人类第一次尝试使用计算机进行图像分析就是使用了显微镜图像。近几年,人工智能在血细胞的识别方面取得了较为显著的进展。Choi等[1]研究人员利用卷积神经网络(convolutionalneuralnetworks,CNN)算法,对张骨髓涂片图像进行训练和测试,开发了一个骨髓细胞分类系统。该系统不需要单细胞分割或手工提取特征,按红系和髓系的成熟程度将细胞分类:4个阶段的红系细胞(原始红细胞、早幼红细胞、中幼红细胞和晚幼红细胞)和6个阶段的髓系细胞(髓系原始细胞、早幼粒细胞、中幼粒细胞、晚幼粒细胞、杆状核粒细胞和分叶核粒细胞),分类准确率为97.06%,精确度为97.13%。该方法中细胞发生旋转或位置改变都不会影响结果,因而识别过程中图像不必再旋转角度,从而节省时间和计算的工作量。Rehman等[2]利用Alexnet模型和CNN相结合的深度学习技术,提出了一种区分急性淋巴细胞白血病(acutelymphoblasticleukemia,ALL)亚型和正常人骨髓涂片图像的方法。研究者收集L1图像幅、L2图像幅、L3图像30幅和正常骨髓图像幅,其中80%用于测试集,20%为验证集。结果显示该方法分类准确率可达97.78%,可作为诊断ALL及其亚型的工具。此外,不同的研究团队在慢性粒细胞白血病、B细胞淋巴瘤、急性髓系白血病(acutemyeloidleukemia,AML)的肿瘤细胞识别和诊断方面,也开发了相应的分类方法或系统[3,4,5]。只是目前的研究还都依赖于对回顾性数据的分析,尚没有前瞻性地应用于临床,其准确率有待进一步验证。(二)AI在免疫表型分析的应用流式细胞学具有操作简便、敏感度高、可定量等特点,是免疫表型分析的主流方法,也是血液系统疾病诊断的关键技术。AI与流式细胞技术的结合无疑会进一步推动流式细胞学在临床的应用,并极大地提高血液系统疾病的诊断率。年美国血液学会议上,H?llein等[6]报道了人工智能辅助多参数流式技术诊断B细胞淋巴瘤的结果。该研究包括了例B细胞淋巴瘤患者和名健康对照者数据,其中包括:慢性淋巴细胞白血病(chroniclymphocyticleukemia,CLL)例、CLL伴幼稚淋巴细胞增多(CLLwithincreasedprolymphocytes,CLL/PL)例、滤泡性淋巴瘤(follicularlymphoma,FL)例、毛细胞白血病(hairycellleukaemia,HCL)例、淋巴浆细胞淋巴瘤(lymphoplasmacyticlymphoma,LPL)例、套细胞淋巴瘤(mantlecelllymphoma,MCL)例、边缘区淋巴瘤(marginalzonelymphoma,MZL)例、单克隆B淋巴细胞增多症(monoclonalB-celllymphocytosis,MBL)例。研究者利用神经网络算法建立了诊断模型并使用10倍交叉验证对结果进行确认。该模型区分健康人与CLL或MBL患者的准确率高达97%;区分健康人与CD5阳性B细胞淋巴瘤(CLL、MBL、MCL和CLL/PL)以及健康人与CD5阴性B细胞淋巴瘤(FL、LPL、MZL和HCL)的准确率均为89%。Ko等[7]收集了例AML和骨髓增生异常综合征(myelodysplasticsyndromes,MDS)患者的份流式细胞学数据,其中份数据为预测临床预后的数据集,其余数据按照4∶1的比例分为训练集和验证集。经过学习优化后的算法,在不同的流式细胞检测平台上,区分AML患者与健康人的准确率为89.4%~92.4%,区分MDS患者与健康人的准确率达到84.9%~90.8%,区分患者(AML和MDS)与健康人的准确率在84.6%~89.7%。此外,该算法处理一份数据的平均时间约为7s,而通常一个经验丰富的诊断医生大约需要花费10~20min。以上两项研究将流式细胞学和人工智能融合在大规模数据上进行应用,显示出人工智能算法对流式细胞学数据高效准确的分析,提示AI辅助的流式细胞学常规用于诊断血液系统疾病的可行性。(三)AI在细胞遗传学分析的应用染色体核型分析可以判定染色体数量和结构的异常,在白血病、MDS、骨髓增殖性肿瘤和部分淋巴瘤亚型的诊断中具有重要的价值。为了保证结果准确,进行染色体核型分析时,通常每份标本需要选取20个以上处于分裂中期的染色体图像,然后进行分割、排列和识别,耗时较长,而且依赖于有经验的技术人员进行图像识别。目前已有基于染色体全自动扫描系统开发的自动化识别软件投入应用,如IKAROS、LABBM9系统,但是这些软件对于重叠、粘连的染色体尚需要手工分割,染色体的配对和排列的准确率较低,需要人工调整,而且无法自动识别染色体的结构异常。年Hu等[8]将CNN算法应用到染色体核型分析中,该方法设置了6个卷积层、3个池化层、4个丢失层和2个全连接层,能将染色体分为24类(22对常染色体、X染色体和Y染色体)。研究者首先将91个分裂中期图像中的染色体基于边缘轮廓进行切割,取其中个未折叠的单个染色体图像用CNN进行识别,分类准确率达到93.79%。近期,李康等[9]提出了一种基于CNN和几何优化的染色体核型分析新方法。他们首先利用MaskR-CNN将中期图像分割为单条染色体;然后针对弯曲、重叠、相互接触的染色体,利用基于中轴的染色体伸直优化算法,将染色体进行几何优化操作,从而显著提高数据质量;最后将分割后的染色体用一种新的卷积神经网络(多输入CNN)算法进行分类,准确率可达95.6%。由此可见,CNN在染色体分割和分类中均表现出良好的性能,为构建智能化核型分析系统提供了新的解决方案。荧光原位杂交(fluorescenceinsituhybridization,FISH)可弥补染色体核型分析分辨率低、标本要求高等不足,同时实验操作时间短,是细胞遗传学分析不可或缺的技术手段。然而该技术同样依赖于人工在显微镜下对荧光信号进行半定量分析。目前AI在FISH方面的进展主要体现在对图像的信号分割和分类。Lerner等[10]用神经网络分类器来区分真实荧光信号和背景假荧光信号,此分类器不受探针数目的限制,准确率都在83%~87%。此外,由于FISH的研究大多局限于点信号分析,Lerner等[11]又基于多层感知机和朴素贝叶斯分类器提出了点信号和非点信号的分割与分类方法,分类准确率达到80%左右。(四)AI在分子生物学检测的应用血液系统疾病是分子生物学技术最早渗透、应用最广泛的领域,随着分子生物学技术的不断更新迭代,血液系统疾病已进入“精准诊断”时代。高通量测序技术凭借高通量、高灵敏度和低成本的优势,被迅速应用于血液系统疾病的临床检测。高通量就意味着有大数据,如何从大量数据中挑选有意义的分子改变,并挖掘这些改变与疾病发生发展的内在规律是研究的重点。AI由于其强大的数据分析计算能力,有可能推动该领域的突破性进展。Mei等[12]利用深度学习的方法,根据患者年龄、细胞遗传、基因突变等数据预测AML的预后。研究者从TCGA(癌症基因组图谱)数据库中收集了94例AML患者(10例用于模型训练,84例用于模型验证),用R语言编写深度学习模型。初始分析中,输入患者年龄、10个常见的遗传学改变和23个常见的基因突变,输出结果为AML患者的预后状态(死亡天数或d)。由于标本数量较少,研究团队采用10倍交叉验证法验证结果,最终该模型预测准确率为81%。若将输入参数调整为患者年龄、7个常见的遗传学改变[tri8、del5、del7、复杂染色体异常、t(8;21)、inv(16)、t(15;17)]和6个常见的基因突变(FLT3、NPM1、TP53、DNMT3、KIT、CEBPA),该模型预测准确率将提高至83%。由此可见,通过全面的基因检测和人工智能技术的结合,可将独立的基因检测数据与其他临床信息有效地综合起来分析,帮助临床医生为患者制定更精准的诊疗策略。(五)AI在综合诊断中的应用血液系统疾病的初步诊断依赖于病理医生对各实验室数据进行分析,结合临床表现综合判断。这就要求病理医生兼具临床及血液病理各专业知识的背景。目前病理医生缺口高达数万的背景下[13],AI有望成为辅助病理医生进行综合诊断的有效工具。借助于AI强大的学习能力及计算能力,模拟病理医生的诊断标准及诊断思路,提取各专业实验数据的关键信息并整合分析,从而实现对血液系统疾病的辅助性综合诊断。
二、AI应用中面临的问题
(一)缺乏标准数据数据是AI应用的基础,然而,现阶段高质量数据的缺乏已经成为制约人工智能发展的瓶颈之一。虽然我国人口基数大,在病例数方面有优势,有利于建立大数据,但是,目前多数医疗机构各自独立,数据难以互联互通,无法共享。另外,由于各实验室检测平台、操作流程、检测试剂等的差异,导致同类数据质量参差不齐,缺乏标准化和规范化。因此,如何筛选并构建有效的数据集,是AI应用到医疗行业首先需要解决的难题。目前,美国和英国等发达国家已经搭建了成熟的数据共享平台,并建立了完善的数据标准体系。我国相对而言起步较晚,但相关大数据建设*策已经陆续出台。在*策的引导下,逐步完善立法和管理制度,是保障数据安全和最大程度共享的前提。本课题组依托中国生物医学工程学会,正承担白血病人工智能形态学数据集标准的建立,期望该团体标准的制定能进一步推动血液病数据集行业标准的快速开展。(二)缺乏专业人才AI人才培养落后于技术的发展导致AI专业人才的缺乏,并已经成为AI应用的另一个挑战。而血液系统疾病诊断是专业性极强的学科,这就要求AI人员在研发过程中能对血液系统疾病有基本的认识和理解,显然同时具备血液学和AI背景的人才更是稀缺。因此,复合型专业的设置及人才的培养是解决此问题的重要途径。(三)缺乏AI产品标准AI产品的临床应用首先需要获得医疗器械注册证,但是相关产品的性能检测及审批标准的制定都还在起步阶段,因此我国医疗AI产品临床应用进展还显缓慢。最近国家药监局及中国食品药品检定研究院已陆续颁布了相关标准,但是针对血液系统疾病AI辅助诊断方面的专用标准尚处于空白。
三、AI对未来血液病理诊断模式的影响
1.人工诊断到AI辅助医生诊断:目前血液系统疾病的诊断主要依赖于人工对形态学、免疫学、遗传学和分子生物学等多技术平台的结果进行综合分析,AI的加入有望实现以人工诊断为主的模式向AI辅助人工诊断模式的转变,主要体现在:(1)医院由于诊断人员缺乏或诊断水平有限,限制了一些检查项目的开展,不便于对疾病进行精确诊断,而成熟的AI分析模型可弥补技术缺陷。(2)对于依赖主观判断的检查,比如形态学观察及核型分析,假阴性通常是实验室不易规避的问题。尤其是对于一些微小的改变,肉眼通常无法区分,例如inv(16;16),染色体片段大小不变,主要依赖于肉眼对带型的判读,当深带和浅带差异不明显时,容易导致假阴性。而AI本身具有强大的图像识别能力,可以分辨带型之间的细微差异,从而减少假阴性。(3)AI软件评估较人工分析更全面。形态学的检查通常会人工选取一定数量或者特定区域去分析,比如骨髓涂片一般计数个细胞,FISH检查则计数个细胞,这可能会造成一些重要信息的遗漏,而AI可在短时间内对全片进行评估计数,避免信息遗漏,提高诊断准确性。(4)AI模型具有较强的学习能力,经过大量多样化数据的训练,协助医生进行初步诊断及结果复核,避免由于医生经验不足或主观偏见造成罕见病例或不典型病例的误诊漏诊。(5)相较传统的人工诊断,AI的高速运算能力可以使报告的分析诊断时间以秒为单位,显著提高工作效率。2.线下诊断到线上诊断:借助于AI和互联网,可以搭建线上会诊平台,根据用户端提交的检测数据,线上嵌入AI模型可以直接导出初诊结果,为患者提供下一步的就医方向,缩短就医周转环节和时间,医院接诊压力,缓解看病难的问题,降低医生工作强度,改善就医环境。诊断模式由传统的人工诊断向AI辅助医生诊断、由线下诊断向线上诊断的变革,帮助缓解血液病诊断医生匮乏、基层人员诊断水平低、工作效率低、医疗资源分配不均等问题。但同时,AI在血液系统疾病中的应用尚处于早期阶段,面临如上所述的各种挑战,需要*府部门、医疗机构、AI企业等各方通力合作,共同推动AI产品的研发及落地。利益冲突 所有作者均声明不存在利益冲突
选自中华检验医学杂志,,43(12)
更多精彩推荐,请