基于气相色谱质谱研究肺癌呼气特征性挥发有机化合物
引用本文:吕伟,石雯闽,尹怡,等. 基于气相色谱质谱研究肺癌呼气特征性挥发有机化合物[J]. 化学试剂, 2024, 46(6):17-25.
DOI:10.13822/j.cnki.hxsj.2023.0812
2023.0812基于气相色谱质谱研究肺癌呼气特征性挥发有机化合物.pdf
背景介绍
肺癌是发病率和死亡率增长最快,对人类健康和生命威胁最大的恶性肿瘤之一。肺癌的早期诊断主要依靠影像学、病理学和肿瘤标志物检测,但这些方法大都灵敏度低,具有辐射暴露、假阳性率高且侵入性,因此亟待寻找一种非侵入性、灵敏度高、样品易得且安全简便的方法用于肺癌的早期诊断。近年来,基于呼气挥发性有机物(VOCs)分析的呼气诊断技术显示出巨大的潜力,在肺癌及肺部炎症早期诊断领域备受关注。
文章亮点
1.本研究在增大样本量的同时设置了疾病对照组(乳腺癌患者),筛出了肺癌和乳腺癌患者的共有特征性VOCs,减少因样本量过小和其他疾病可能造成的呼气特征性VOCs筛查结果的偏差;
2.根据筛选出的8种特征VOCs在不同群体呼气中的浓度差异和相关代谢机制建立了机器学习模型,发现SVM机器学习模型具有高准确度、精准率、灵敏度和特异性,可以准确区分受试者是否患有肺癌,为呼气诊断运用于肺癌提供新的思路和方法。
内容介绍
1 实验部分
1.1 主要仪器与试剂
1.2 研究对象与分组
1.3 呼气样品采集
1.4 呼气检测
1.5 数据分析
2 结果与讨论
2.1 呼出气体中特征性VOCs
将采集到的肺癌患者、乳腺癌患者和健康对照组的呼出气体VOCs进行GC-MS分析,依据差异倍数log2FC>1且P<0.05,将检测到的VOCs绘制火山图,如图1所示。
OPLS-DA是一种有监督的判别分析方法,在降维的同时考虑了分组信息,目前广泛用于特征选择及分类[15]。本研究将测得的健康对照组、肺癌患和乳腺癌患者的VOCs浓度信息建立OPLS-DA模型,如图2所示。
为进一步探究肺癌患者呼气中的特征性VOCs,将测得的健康对照组和肺癌患者的VOCs 浓度建立OPLS-DA模型,如图3所示。
如图3d和表3所示,当VIP≥1.5时,共筛选出8种存在显著差异的VOCs (P<0.05)。特征性VOCs的浓度变化箱式图具体如图4所示。
2.2 肺癌特征 VOCs 的相关信息
为进一了解8种特征性VOCs对肺癌的诊断能力,计算肺癌患者筛选出的8种特征VOCs曲线下面积(Area under the curve,AUC)及其联合诊断能力,具体信息如表3和图7所示。
2.3 机器学习模型的建立与评估
2.4 特征VOCs的代谢途径
将肺癌患者呼气中具有显著差异的 VOCs(P<0.05)导入最新的差异代谢物 KEGG 数据库进行通路分析,发现15条代谢通路,如图8和表8所示。
3 结论
本研究基于TD-GC-MS对176名肺癌患者,50名乳腺癌患者和134名健康人群的呼出气体进行研究。通过OPLS-DA模型发现有10种VOCs可以区分肺癌和乳腺癌,有8种VOCs可以区分肺癌患者健康人群,其中有3种VOCs,4-甲基-2-戊酮、正辛烷 和苯同时出现在肺癌和乳腺癌患者中,可能是两种癌症共同的特征性VOCs,有5种VOCs为肺癌独有的化合物包括:顺式-2-丁烯、戊醛、三氯乙烯、2,3,4-三甲基戊烷和萘。此外,基于肺癌患者呼气中发现的8种特征性VOCs建立了 SVM 的机器学习模型,其准确度、精准率、灵敏度和特异性分别达到95.41%、95.15%、93.99%和96.67%,本研究建立了一种呼气VOCs 用于无创诊断肺癌的方法,同时联合代谢数据库,解释了这些 VOCs 可能的来源和代谢途径,为呼气用于肺癌的诊断提供了一些新的思路和方法。在未来的研究工作中,我们将进一步细化肺癌分期,增加样本量,提高肺癌呼气特异性VOCs筛查的准确性。