返回
顶部
【热点文章推荐】QSAR建模及其在抗病毒药物设计与筛选中的研究进展

QSAR建模及其在抗病毒药物设计与筛选中的研究进展

陈硕,李非凡,孙国辉*,赵丽娇,钟儒刚

(北京工业大学环境与生命学部环境与病毒肿瘤学北京市重点实验室,北京  100124)

摘要


    新药研发往往是一件过程漫长且人力物力投入极大的事情。随着日益严重的环境污染问题对人类生命健康形成的挑战,快速研发高效低毒的药物成为当务之急。定量构效关系(QSAR)在历经几十年的发展后,广泛应用于药物科学领域中,作为药物筛选及其生物活性预测的高效工具,在药物活性、毒性和渗透性预测以及作用机制等研究中发挥重要作用。重点介绍了QSAR建模过程及其近年来在抗病毒药物设计与筛选中的研究进展,并对现阶段QSAR应用的局限性问题进行了分析,展望了其未来的发展方向。


引言


在新中国历史上,由病毒引发的重大突发公共卫生事件有两次,第一次是非典型性肺炎(SARS),第二次就是去年在全世界范围内大规模传播流行的新型冠状病毒肺炎(COVID-19)。其实病毒我们并不陌生,从原始社会发展至今,病毒从始至终伴随左右,在国际病毒分类委员会(ICTV)的最新统计报告中,人类已发现病毒4958[1]。根据科学家估计,该报告范围还不及全部病毒种类的1%。在众多病毒中,不少类别对人类生命健康有严重危害,如人类免疫缺陷病毒(HIV)、冠状病毒、乙肝病毒(HBV)、丙肝病毒HCV)以及人乳头瘤病毒(HPV)等。

着眼当下,从新冠肺炎爆发至今,国际医药界始终致力于抗新冠药物及疫苗的研发工作,目前已经取得不少阶段性进展,由此可见药物科学研究在保障人类生命健康中发挥了重要作用。通过提取、合成、检测等步骤,新的药品被生产出来,但在投放临床之前,仍需要对其药效和毒性等指标进行检测。因为这些人工合成的药品在具有抗病毒疗效的同时,有可能对人体健康和环境生态造成损害,如抗病毒药物的肠道副作用、致突变和致癌作用以及制药废水废气排放造成环境污染等问题。

美国化学文摘社(ChemicalAbstracts ServiceCAS)网站显示截止2020年,已有登记化合物16700万余种,并且新型化合物以每天1.5万的速度在增加[2]。但是,在美国毒理学数据网站(Toxicology Data NetworkTOXNET)中,仅记载450余万种化合物关于人或动物的毒性研究数据[3]。显然每年研究的有毒化合物数据远不及新增化合物数量。但要对众多化学物质逐一进行生物毒性检测实验显然不可企及,同时新型抗病毒药物研究是一件经济、时间成本很高的工作。据相关统计,成功将一种新药应用于临床治疗当中,平均需要花费10余年,筛选数万种化合物,新药的研制仍主要依赖反复试验[4]。病毒又因其基因结构特性极易发生突变,仅最为常见的甲型流感病毒(Influenza A virus)就有H1N1H5N1H7N1H7N2H7N3H7N7H7N9等多种类型,常规的药物筛选恐怕难以追上病毒变异的步伐,因此急需一种快速高效的抗病毒药物设计与活性预测方法,即在对一类化合物进行有限次数的实验后,可以根据所得的实验数据,结合化合物的分子结构信息,对同类未知化合物的活性或毒性进行预测的方法,这就是我们熟知的化学计量学(Chemometrics)。借助此类方法,将为进一步的药物分子设计与筛选、新型化合物合成开辟新途径,其中定量构效关系(Quantitative StructureActivity RelationshipQSAR)是此类方法在药物科学领域研究中的热点之一,该法也被应用于抗病毒药物的研发工作当中。




正文部分

1  QSAR简述

QSAR指通过数学方法建立化合物的分子描述符与其生物活性/毒性之间的线性或非线性关系模型,在分子水平上阐明分子结构与化合物的生物学及物理化学特性之间的关系,为新型药物设计、活性及毒性预测等奠定基础。相比传统的药物活性筛选需进行的体外实验、体内动物实验以及限定人体观察等,QSAR可以大大缩减实验时间、节省人力、降低实验成本。

2  QSAR发展历程

药物科学QSAR研究的早期发展历程如表1所示[8]Crum-Brown等最早提出药物的生物活性与其分子结构间存在某种函数。随后Hansch的线性自由能相关模型Free-Wilson的可加性模型和Bocek-Kopecky的相互作用模型的提出标志着SAR研究向QSAR研究迈出坚实一步[8]1975年,Randic[9]画出了分子结构拓扑图,同年,HallKier将其发展成至今仍广泛应用的分子连接性方法QSAR发展至今,所建立的模型数不胜数,建模方法也不胜枚举,目前应用范围较广的方法包括拓扑学法量子化学法、加和效应法和线性自由能相关法这四大类。


3  QSAR建模过程

QSAR建模程一包含以下4步骤:(1数据收集;(2)计算与筛选分子描述符;(3)模型建立;(4)验证与评价。

3.1  数据收集

广义上,在药物设计中,用以建模的化合物数据主要包括以下几类:1针对靶标的活性,如酶活性的半数抑制浓度和细胞活性的半数抑制浓度等;2生物毒性,如口服急性毒性LD50、最小作用剂量MED、突变性和致癌性等;3理化性质,如溶解性和血脑穿透能力等;4环境中转化的表征参数,如水生毒性和降解速率等。数据的可靠性是模型有效的前提,只有通过可靠实验数据建立的模型才具有实际应用价值。

3.2  计算与筛选分子描述符

QSAR研究领域,人们可根据化合物结构推导出来某种与之对应的数值指标,这些指标就化合物物理化学性质微观上的描述,将此称作其生物学性质上某一“指纹”的“微观显示”,即分子描述符。

3.3  模型建立

QSAR模型可分线性与线类建模方法线模型中主要应用多元线性回归(MLR、主成分分析PCA偏最小二乘法(PLS方法;GA支持向量机(SVM人工神经网络(ANN能较处理线

3.3.1  多元线性回归

3.3.2  遗传算法

GA是根据大自然生物进化规律,模拟生物基因发生改变的现象,探索复杂模型的组合优化问题,通过选择、交叉和变异等过程的模拟组合,得到备选的多组自变量与因变量,通过适应度是否达到阈值或最优个体适应度上升趋势来判断其优劣,直至满足要求,得到最优QSAR模型[19]

3.3.3  主成分分析

在含有多变量的分析中,PCA常被作为简化数据的方法。该方法可以通过正交变换,完成变量线性到非线性的转化,从而简化QSAR建模进程。Bernardo[21]通过方法构建QSAR模型,对多环芳烃致癌毒性的预测得到了较好结果。

3.3.4  偏最小二乘法

PLS可以看作是MLRPCA两种方法的结合,通过最小化误差的平方和筛选最优数据,排除原有信息中线性重叠的分子描述符,并且适合样本容量不足时构建QSAR模型[22]

3.3.5  人工神经网络

ANN是对人脑处理数据时神经元的模拟,将大量节点之间构成联系,建立模型,常用于构建非线性QSAR模型,但存在一定的不稳定性,需要提前筛选描述符才能构建有效模型。

3.3.6  支持向量机

SVM是一类监督学习方式,它建立在结构风险最小化原理基础之上,通过寻找最优超平面进行非线性分类,从而将非线性特征问题的分析向线性分析转变,被广泛用于分类问题和回归问题的解决中[23]

3.4  模型验证与评价

模型建立后,需要对模型进行验证与评价,以检验模型对真实未知化合物的预测能力。评价模知化合物的效应终点是否具有较好测能是验证的目的包括模型的稳健性、拟合能力预测能力

3.4.1  部验

部验常将交叉中的一法LOOY-LOO的原测试后将其训练。重复化合被作为测试集验证

3.4.2 外部验证

部验无法评估模型对真实外部化合物的预测能力。评估模型的预测能力需要准备测试集没有参与模型构建


4  QSAR在抗病毒药物设计中的研究进展

QSAR经过50余年的发展,如今已在医药科学、毒理学环境与生态学、材料科学及化学等诸多领域得到广泛应用。如今,人类社会在追求高经济效益的同时,给环境带来了不同程度的破坏,环境污染问题愈发严峻。同样严重的还有人类对于野生动物的猎杀和捕食行为,致使多种新型病毒在动物与人以及人与人之间传播,由病毒引发的各类疾病不仅对人类生命健康造成危害,还会使人们产生恐慌情绪,社会经济发展受到影响甚至停滞,新型传染病如新冠肺炎给人类生存和发展造成巨大冲击。

4.1  QSAR在抗HIV药物设计中的研究进展

人类免疫缺陷病毒(HIV)是一种突变率极高的RNA病毒,能与人体T淋巴细胞CD4受体特异性结合,临床表现为免疫机能几乎丧失,具有潜伏期长、传染率高、病死率高,同时会诱导机体产生肿瘤,是一种对人类生存有着严重威胁的病毒。

4.2  QSAR在抗HBV药物设计中的研究进展

乙型肝炎病毒HBV是一种对人类健康构成极大威胁的DNA病毒,截至2020年,WHO数据显示全球将近3亿人感染HBV[31]。但由于抗病毒疫苗及药物研究的不断发展,我国乙型肝炎患病人数呈逐年递减趋势,其中芳基丙烯酰胺类化合物对抗HBV特异性较强,是抗HBV药物研究中重要的化合物来源。

4.3  QSAR在抗HCV药物设计中的研究进展

丙型肝炎病毒(HCV)是引发肝脏急慢性炎症的主要原因,同样是肝硬化和肝细胞癌的主要诱因。据WHO网站显示,仅2016年就有将近40万人死于HCV所引发的一系列疾病。值得庆幸的是,目前虽然没有有效的HCV疫苗,但抗病毒化学药物可以治愈绝大多数HCV患者,从而减少关联的肝硬化和肝癌死亡风险,因此快速有效的抗HCV药物筛选就成为了首要任务。

4.4  QSAR在抗新冠病毒药物设计中的研究进展

2020年初,新冠肺炎COVID-19席卷中国,并在世界大规模传播,而后此病毒被ICTV命名为SARS-CoV-2,这也就是新冠病毒。

4.5  QSAR在其他抗病毒药物设计中的研究进展

近年来,QSAR在抗病毒药物筛选与设计中的应用十分广泛,除抗病毒药物的研究,还常用于抗流感病毒等药物的设计中。

5  结论与展望


结论与展望

QSAR发展至今已有50余年历史,已成功应用于诸多领域,成为国际上的研究热点之一。随着药物科学和计算机技术的不断提升,QSAR在药物科学领域的作用将愈发重要,既可以指导设计合成高效低毒的药物,还可以提供许多具有类似药理活性的化合物线索,对于药物分子前期设计、先导化合物改造、毒性预测及安全性评价都具有十分重要的意义。
引用本文:陈硕,李非凡,孙国辉,等. QSAR建模及其在抗病毒药物设计与筛选中的研究进展[J].化学试剂, 2021, 43(7):895-905.


Produced By CMS 网站群内容管理系统 publishdate:2025-11-18 14:00:50