什么是(Q)SAR?
即(Quantative) Structure-Activity Relationship。中文为″(定量)结构活性关系″。它是一种研究化学物质结构(或结构相关属性)与其生物活性/理化特性关系的方法,能用于预测化学物质的毒性。
在农药原药等同性评估中(Q)SAR多重要?
原药等同性认证是非专利农药原药进入全球各国或地区市场的一种快捷通道。
现今全球普遍都采用的是两阶段的原药等同性评估流程,来评估新来源(新登记原药)相比于参考来源原药(已登记原药)是否是化学组分等同或毒性等同的。两阶段的等同性评估中第一阶段为化学评估,主要是定性/定量新来源中各种杂质的结构与含量。当第一阶段化学评估不能通过时,即与参考来源相比,新来源中出现了新杂质或现有杂质含量增加,则需要进入第二阶段的毒理学评估,以确保新来源与参考来源具有等同的毒性效应。
包括欧盟、澳大利亚、巴西等国家和地区,在第二阶段毒理学评估中引入(Q)SAR预测,首要目的是确定新来源杂质是否具有潜在的健康或生态毒性。如果所有杂质(Q)SAR预测结果都理想,结合必要的毒理学试验(如体外基因毒性实验和急性毒性实验等),或者采用危害分类和风险评估方法,即能够较为充分证明新来源与参考来源原药毒性等同,则不需要再要求提供其他毒理学实验资料。因此,在等同性评估中引入(Q)SAR预测,既能较为充分地确保毒理学评估的全面性,也能避免高昂的毒理学实验并缩短登记周期。
(Q)SAR原理与方法
(Q)SAR的基本假设是,相似结构的分子具有相似性质。从定义上来说(Q)SAR是一种描述分子结构与效应之间的定量/定性关系,即我们希望能通过建立的模型关系,直接基于待测物的分子结构,来预测待测物的效应,而这种方式的优势在于我们不需要依赖于周期长、费用高的传统的试验测定方法。
通常而言,(Q)SAR模型的的建立由如下 5 个步骤构成:
全球农药法规中(Q)SAR的要求
欧盟
欧盟不同成员国(Q)SAR报告的要求是不同的,但具体(Q)SAR模型的要求可以划分为 Rule-based模型 和 Statistic-based模型 两类,在评估报告中需要从毒理学角度对(Q)SAR预测结果进行解释与说明,并对杂质进行相应的危害分类或风险评估。也可以参考部分的原药试验数据(如急性五项,Ames试验等)来补充说明,以判断杂质是否为相关杂质。同时应特别关注基因毒性、内分泌干扰效应等。
巴西
一般至少需要使用三个不同的QSAR软件(Three expert systems),(Q)SAR软件的预测必须涵盖必要的模型节点,如致畸、致癌和致突变效应等,必要时也需要增加其他节点,如内分泌干扰效应等,如果可能的话最好能将(Q)SAR软件中所有的节点都进行预测。此外,也需要从毒理学角度对(Q)SAR预测结果进行解释与说明。
澳大利亚
澳大利亚要求同时提供Rule-based模型和Statistic-based模型这两类的预测结果,但与欧盟不同的是——澳大利亚重点会关注基因毒性与致癌性的评估,也需要从毒理学角度对(Q)SAR预测结果进行解释与说明。当两类预测结果都理想的情况下就可以豁免能表征杂质毒性的Ames试验等毒理学实验资料。
俄罗斯
需要采用(Q)SAR模型对必要的毒理节点进行预测,重点关注基因毒性,特别是能反映致突变性的相关数据节点,但未具体要求(Q)SAR模型的类型。若(Q)SAR预测结果不理想,官方可能会要求直接针对杂质开展相应的Ames试验。
墨西哥
(Q)SAR预测节点只要求提供对经口急性毒性(LD50)的预测,其他的节点如致畸、致癌、致突变等是墨西哥官方所不要求或适当条件下被认为是不必要的,但不排除需要提供的可能性。采用的预测模型的数量应根据结果来确定,比如在一个模型中预测结果不理想,则应再提供一个或多个模型进行表征,直到能有充分的(Q)SAR证据说明问题。建议企业至少提供2个模型的预测结果,但具体是否达到要求还需要根据毒理学原理来综合评估。最后得到的LD50的预测结果,还需要依据FAO的方法进行计算,来判断同参考来源相比毒性是否是等同的。
(Q)SAR应用的难点解析
Rule-based模型与Statistic-based模型的差异
规则模型(Rule-based models)是基于专家经验建立结构与效应之间的关系,主要表现为对结构警报(structural alert)的识别;统计模型(statistic-based models)是基于统计模型建立结构与效应之间的关系,常见的统计模型有线性、KNN、随机森林、支持向量机(SVM)、神经网络模型等。
(Q)SAR预测报告的格式要求
在当前全球农药原药等同性评估中,对(Q)SAR模型报告并没有像REACH法规那样,强制要求对(Q)SAR预测提交QMRF和QPRF形式的报告,但该形式的(Q)SAR预测报告由于是依据OECD (Q)SAR的″五准则″要求制作的,所以适用性强,能满足几乎全部国家和地区(Q)SAR报告的要求。QMRF:(Q)SAR Model Reporting FormatQPRF:(Q)SAR Prediction Reporting Format对于基于结构警报的规则模型预测结果,也可以采用其他形式的报告格式,但必须充分验证模型结果,并给出具体的毒理学评估依据。
各国评审机构为何要重点关注基因毒性?
在农药原药等同性评估中,针对于杂质的基因毒性几乎都是各国评估的重点。主要原因在于基因毒性(Genotoxic)物质被认为是无毒性阈值的,不严格地讲可以认为只要存在基因毒性化合物的暴露,对人体就有可能引起直接的DNA损伤,进而大大增加了癌症诱发概率。正应如此,即使不同来源原药中杂质的含量极低,对其基因毒性效应也应充分评估。
进一步的毒理学评估
毒理学数据查询
基于证据权重(Weight of Evidence)的方式,通过数据库系统检索相关的毒理学数据,并评估所有毒理学数据的有效性与可靠性,以明确杂质或目标化合物的危害值。
交叉参照(Read-Across)
交叉参照,即由一个(或多个)化合物的节点信息预测另一个(或多个)具有相似特性的化合物的同一节点,从而替代测试数据。针对于杂质或目标化合物,交叉参照主要是基于专家经验从结构相似性、代谢相似性与趋势分析三个方面来开展的。
毒理学关注阈值(TTC)
TTC定义了未经研究的化合物在致癌或其他毒性作用风险可忽略时的可接受摄入量。确定TTC的方法总体上可认为是非常保守的,它是将50%肿瘤发生率(TD50)的剂量简单线性外推到百万分之一发生率而得,且采用的TD50数据来源于最敏感物种和对诱导最敏感的肿瘤发生部位产生的数据。
定量毒性阈值计算
为了进一步得出杂质在农药原药中合理可靠的限度范围,需要明确杂质本身定量毒性阈值,可以通过毒理学数据查找、交叉参照或毒理学关注阈值(TTC)的方式来定量描述杂质的毒性大小,然后再保守的考虑相关的不确定性,从而计算得出每日允许暴露量(PDE/ADE)或可接受摄入量(AI)用于杂质限度控制。
杂质限度控制
杂质限度控制是基于风险评估的原理,比较杂质的危害量(由定量毒性阈值得出)与潜在暴露量(由ADI/AOEL并考虑杂质含量杂质而得出),来判断杂质的含量水平是否在限度范围内。
内分泌干扰效应评估
基于欧盟农药与消毒剂的内分泌干扰评估指南,在Level 1和Level 2试验中可以采用分子对接(molecular docking)、(Q)SAR预测等方式来评估目标化合物是否具有潜在的内分泌干扰效应或阐明相关的作用机制。
皮肤致敏的限定方法(OECD TG 497)
在2021年6月发布的OECD TG 497首次公布了针对于皮肤致敏性评估的限定方法,该限定方法规定了仅用3种与皮肤致敏有害结局路径(AOP)中关键事件(KE)相关的体外试验测试方法和2种(Q)SAR软件,并按照规范化的流程来对目标化合物的皮肤致敏性开展评估。
新农药研发中的计算毒理学评价
针对于农药研发中新发现的活性化合物,开展相应的计算毒理学评价,来预测这些化合物或其分子片段是否具有潜在的毒性效应,从而优化分子设计,加速新农药的研发上市。
(Q)SAR预测系统
在农药原药等同性评估中,瑞欧科技可为客户提供多达十几种(Q)SAR软件预测与专家评估服务。同时,为了进一步提高预测结果的有效性和可靠性,瑞欧科技也于近期正式上线了全球领先的(Q)SAR预测系统Derek Nexus & Sarah Nexus,能够全面的对毒理学节点展开更高质量的评估。
Derek Nexus介绍 - 规则模型(Rule-based models)
Derek Nexus是欧盟农药等同性评估和其他(如巴西)国家农药监管机构推荐使用的(Q)SAR软件预测系统,也被医药监管机构FDA、EMA和NMPA所广泛采用。
特点:
Sarah Nexus介绍 - 统计模型(statistic-based models)
Sarah Nexus基于一种新颖的层次聚类模型SOHN方法来自学习训练集中的碎片化分子结构,通过这种机器学习方法从而灵敏的识别目标分子中与基因毒性相关的结构特征。
特点: