
背景介绍
定性化学分析在环境监测、食品安全、临床诊断等关键领域发挥着不可或替代的作用。传统定性分析主要聚焦于特定目标物的靶向分析,其性能评估已形成相对成熟的统计框架,如基于真阳性率、假阳性率等基础指标以及似然率、置信区间等模型。近年来兴起的非靶向分析技术,能够无偏向性地筛查样本中的化学成分,对现有性能评估体系提出了新的挑战。本文系统梳理从传统靶向模型到非靶向定性分析的性能评估方法与指标,旨在推动定性化学分析的规范应用。
文章亮点
1. 系统梳理了定性化学分析的核心性能评估指标及其统计基础,并分析了降低不确定度的有效途径;
2. 重点探讨了非靶向定性分析的特点,详细分析了高维数据降维和层次聚类等机器学习算法的适用性及其可能引入的不确定度来源;
内容介绍
1 定性化学分析的类型
根据不同类型的定性判别方式不同,定性化学分析可分为基于定性标准的定性分析和基于定量标准的定性分析。
基于定性标准的定性化学分析根据物质的特定属性或反应来进行分类。例如,通过加入希夫试剂后的颜色变化来检测溶液中的脂肪醛;通过观察来鉴别材料的结晶形式;通过测定或检测特定的DNA序列来鉴别生物物种等[3]。
基于定量标准的定性分析是一种使用量化测量结果将研究对象归属于特定类别的方法。这类方法通过浓度、强度或比率等定量特性值来决定一个物质是否符合某个特定的分类标准,需要精确的定量测量和预先设定的阈值或标准。GC-MS、LC-MS、实时定量聚合酶链式反应、分光光度法等仪器化学分析方法是基于定量标准的定性化学分析常用技术手段。
2 性能评估指标
2.1 基础指标及呈现形式
方法性能评估是定性化学分析中的关键环节,应开展可行性研究和方法验证,以实现定性化学分析方法的质量控制,支持定性化学分析结果的准确性。定性化学分析通常可定义一种“二元分类”方案,即分类类别是全面且排他性的,可分别用“阳性”和“阴性”表示。
ROC能够清楚揭示不同判别阈值条件下的分析性能差异,适合用于基于定量标准的定性化学分析[3]。例如,Yao等[8]采用单细胞代谢物含量作为白血病细胞鉴别方式,采用ROC曲线展示了多种代谢物的判别能力,并计算出ROC曲线下的面积(AUC值)在0.909~1.000之间,证明了上述物质有望作为白血病细胞鉴别的生物标志物(图1)。

2.2 不确定度评估指标
2.2.1 似然率
后验概率是指在观察到某些证据或数据后,对某一事件或假设发生概率的重新评估。在定性分析中,后验概率结合了先验概率和观测数据的似然度,可通过贝叶斯定理计算得出。在先验概率已知的情况下,后验概率可以量化检测结果的不确定度,更准确地评估检测结果的可靠性。
3 性能评估方法
3.1 建模法
定量数据建模法适用于基于定量标准的定性分析,是通过构建特征信号的离散模型预测结果的响应率。
3.2 数据库比对法
数据库比对法适用于基于定量标准的定性分析性能评估,通过将测试项目与参考数据库进行偶然错配研究,预估机会匹配概率和似然率。
3.3 文献支持法
文献支持法仅适用于性能信息公开的部分常用的基于定性和定量标准的定性分析程序。需要注意的是,已报道的性能水平仅适用于特定实验条件和分析对象,具体包括特定设备、试剂和人员,以及目标物存在于特定基体和特征水平。
4 非靶向定性分析的性能评估
4.1 非靶向定性分析的特点与挑战
非靶向定性分析是定性化学分析的一个特殊类别,通常需要采用数据降维、可视化和聚类分析等机器学习算法对连续变量设定判别阈值并挖掘化合物信息。例如,主成分分析(PCA)等线性降维方法可以实现最大化方差保留,但其牺牲了非线性结构以简化计算,将三维数据直接压缩到二维平面,导致原本分离的样品在低维空间中折叠,破坏数据的局部或全局几何关系;非线性降维方法能够保留数据的内在流形结构,使原本相邻的样本在低维空间中仍保持临近关系,更适用于复杂拓扑结构(图3)。

4.2 机器学习算法
4.2.1 高维数据降维算法
数据降维可减小数据维度,保留关键信息,实现数据的直观呈现,提高数据分析的效率和准确性。目前已有数十种降维技术被提出,其中常用算法包括PCA[20]、t-分布随机邻域嵌入(t-SNE)[21]、线性判别分析(LDA)[22]、均匀流形近似与投影(UMAP)[19]和自编码器等。
4.3 性能评估指标
4.3.1 数据降维算法评估指标
高维数据降维算法的性能评估是通过对输入数据空间、降维技术和投影质量的特征进行建模,并在这些特征空间中进行采样实现的,可采用三类指标,分别是标量指标、点对指标和局部指标[29]。
5 结论
在定性化学分析中,方法验证与不确定度评估是保障分析结果可信度的关键步骤。本文总结了从靶向分析到非靶向定性分析的性能评估的关键因素。传统统计模型方面,总结了真阳性率、假阳性率、真阴性率、假阴性率、似然率、后验概率、置信区间等定性化学分析的性能评估指标及其呈现形式,分析了不同评估方式的适用场景。非靶向定性分析依赖于高通量、高灵敏度、高分辨率的分析平台,其结果的可靠性取决于数据挖掘和解析能力。在开展非靶向定性分析方法的性能评估时,必须深入研究机器学习算法的适用性、准确性及其对结果的影响,从而确保分析结果的可靠性与有效性。
