FASTDock:针对异构位点的药物发现新策略
导读
FASTDock 能够在无需预先了解配体信息的情况下,发现结合异构位点的小分子。
异构调节不仅在众多生物过程中起着重要作用,在人类疾病中发生发展中占据核心地位。因此,探究异构调节对于研究生物机制和开发新型治疗药物至关重要。小分子异构效应剂的开发,可作为研究感兴趣生物机制的重要工具。这里面我们面对的主要挑战是发现特定受体的异构位点。此外,与正构位点相比,异构位点的发现更具挑战性,因为缺乏关于能在该位点结合的分子类型的信息。在本研究中,研究者介绍了一种名为 FASTDock 的新型药物发现流程。它能够发现可配体化位点及其靶向小分子,且无需预先了解可在该位点结合的配体。该方法采用分层筛选策略,有望实现对庞大靶标配体空间数据库的高通量筛选。
方法
1. FASTDock 探针映射
A. 探针选择
- 小分子作为探针:流程使用 18 种小分子,包括乙烷、乙醇和苯,因其计算负载小且化学性质多样而被选中。
- 化学空间的表征:这些探针有效地代表了配体的广阔化学空间,确保采样了广泛的蛋白质-配体相互作用。
B. 对接和分析
- 基于 FFT 的对接方法:使用快速傅里叶变换(FFT)技术,实现高效对接。
- 聚类和评分:使用基于 RMSD 的 K-means 算法对对接构象进行聚类。保留最佳 2000 个构象,对拥有超过 10 个成员的簇进行进一步分析。
2. 探针的聚类和排名
A. 聚类生成
- 空间聚类:基于空间标准对探针进行聚类,以识别结合热点。
- 结合多种化学类型:将不同化学类型的探针结合,增强识别潜在结合位点的能力。
B. 聚类排名
- 基于接触比率的排名:通过蛋白质与探针的接触比率与探针数量的比值对聚类进行排名,确保选择具有多样化蛋白质-配体相互作用的聚类。
3. 指纹生成和筛选
A. 化学指纹
- FASTDock 聚类指纹:采用 MACCS 指纹生成技术,捕捉聚类中存在的化学特征。
B. 数据库筛选
- TANIMOTO 系数应用:将数据库中分子的化学指纹与 FASTDock 聚类指纹进行比较,使用 TANIMOTO 系数识别高相似度分子。
4. 刚性受体-柔性配体对接
- 进一步精细化:与参考聚类相似的分子经过刚性受体-柔性配体对接,使用 FACTS 隐式溶剂模型进行评分。
基准数据集生成
A. 多样性受体选择
- 九种受体类别:数据集包括各种受体类别,以评估流程在不同结合环境下的性能。
B. 数据集准备
- 高分辨率结构:仅使用分辨率在 2Å 或更好的结构,确保分析的准确性。
C. 活性物和诱饵分子
- 使用 DUD-E 数据库测试:使用 DUD-E 数据库中的活性物和诱饵分子评估 FASTDock 的筛选能力,提供了对其筛选能力的强有力测试。
逆转录病毒蛋白酶
- 数据集选择的理由:每个数据集,包括弹性酶和 MDM2,都旨在测试 FASTDock 流程的特定方面,如定位活性位点和变构位点。
通过 FFTDock 进行探针映射
- 高效对接过程:使用 FFTDock 在 GPU 上以及 Python 脚本,实现高效准确的探针对接。
指纹生成和筛选
- 详细筛选过程:MACCS 键和 TANIMOTO 系数提供了一种细致的筛选过程,增强了潜在配体的选择。
主要结果及图表
FASTDock 是一种能够有效的复现已知蛋白质结合位点的工具。所谓的结合「热点」是指蛋白质表面那些对小分子探针具有高亲和力的区域。在生物学应用,特别是合理药物设计中,这些「热点」的识别至关重要。传统上,这些「热点」的位置通过核磁共振光谱学或 X 射线晶体学等实验方法来确定,通过解析靶标蛋白质在多种有机溶剂中的结构,从而找到小分子的聚集区域。然而,这种方法成本高,耗时长,且受到物理限制。FASTDock 的探针映射工作流程提供了对这些实验方法的计算机模拟。研究者构建了基于 pyCHARMM 的探针映射框架,并将其集成到后续流程中。不同于现有的探针映射网络服务,FASTDock 可以作为一个独立程序,集成到高通量工作流程中。
作者以猪胰蛋白酶弹性酶为模型,验证 FASTDock 的探针映射方法是否能复现所有已知的实验结合位点。他们将 FASTDock 映射的位点与 MSCS 方法映射的位点进行比较。MSCS 方法通过在多种有机溶剂中解析弹性酶的晶体结构,发现有机探针主要集中在活性位点附近。FASTDock 识别出 16 个不同的位点,其中三个与 MSCS 识别的五个热点重合,证明了 FASTDock 探针映射技术能够复现所有已知的实验结合位点。此外,FASTDock 的评分方法优先考虑像口袋一样的可连接位点,发现三分之二的实验确定位点位于排名前十。
研究者还考察了 FASTDock 在预测活性位点方面的表现。使用与抑制剂共晶的蛋白质结构,他们发现活性位点是最显著的结合口袋之一。FASTDock 的评分方法优先考虑这样的结构,理应将该位点排在首位。在三个不同受体数据集中,研究者检查了有多少结构将活性位点排在其顶部位点中。结果表明,虽然 FASTDock 在预测活性位点方面表现良好,但在实际应用中,可能会发现未知的变构位点,这些位点也可能被评为顶级位点。
最后,FASTDock 流程在对接步骤中提高了活性分子的复现率。研究者使用 MACCS 指纹对配体数据库进行筛选,以区分结合者和非结合者。他们选取排名较高的分子进行对接实验,查看是否可以进一步提高区分能力。以 HIV 蛋白酶为例,通过比较使用 FASTDock 集群进行指纹筛选后的对接结果,与使用共晶结构中的已知配体进行筛选后的对接结果,结果表明使用 MACCS 指纹进行预筛选,可以显著提高早期富集率,显示出在区分结合者和非结合者方面的更好表现,并且能显著加速整个虚拟筛选过程。
此外,研究者还探讨了 FASTDock 在复现已知变构位点方面的能力。以 Abl 酪氨酸激酶为基准,他们研究了 FASTDock 在预测变构位点以及活性位点方面的表现。他们注意到,尽管 FASTDock 成功映射到了所有实验已知的结合位点,但在评分和排名后,一些位点不再被识别。这表明,FASTDock 能够识别出 60% 的已知结合位点,包括所有的变构结合位点,但在某些情况下可能需要进一步的优化。
图表 1:FASTDock 工作流程总览
本流程首先利用基于傅里叶变换的对接方法(FFT-based docking Methods) ,将 18 种不同探针映射至刚性输入蛋白结构上。接着,这些探针被聚类并根据识别位点的药物化学可行性进行排名。确定感兴趣的位点后,FASTDock 使用该位点的聚类生成化学指纹。该指纹随后用于筛选化学化合物数据库。最终,配体筛选步骤中排名靠前的化合物子集用于对接。
图表 2:有机探针与弹性酶的结合
结合位点是通过 X 射线晶体学和计算映射确定的。其中,(A) 部分展示了利用 MSCS 技术将探针映射至弹性酶上,该过程基于各种有机溶剂中解析的结构叠加。在 (B) 部分,使用 FASTDock 将探针映射至弹性酶上。而 (C) 部分则展示了与实验鉴定位点重叠的 FASTDock 位点,每个位点用不同颜色区分。
图表 3:筛选和随后对接后,区分 HIV 蛋白酶的结合者和非结合者
图表 4:Abl 激酶的激酶域(PDB: 2HYY)
本图展示了 (A) 25 个不同共晶结构中已知抑制剂的分布,(B) FASTDock 探针对接后的探针映射,以及 (C) 与已知配体结合位点重叠的 FASTDock 位点。在五个已知结合位点中,有三个通过 FASTDock 协议得以确认。
表格 1:FASTDock 流程各阶段的受体基准测试详解
本表展示了各个已报道过对接或探针映射成果的特定受体结构的 PDB ID。
表格 2:活性位点探针映射与 FASTDock 应用效果
表格 3:受体筛选的基准测试结果
本表罗列了在基准测试中表现出最佳富集因子(EF 1)的受体的 PDB ID。
表格 4:基于晶体结构配体(晶体配体)和 FASTDock 筛选的活性分子复现情况
比较与创新
分子对接与探针映射:FASTDock 工作流程的优化
本文通过对 FASTDock 工作流程中的分子对接和探针映射方法的分析,证明了其在区分结合者和非结合者方面的有效性,并展示了其在高通量工作流程中的应用潜力。
- 🧬 探针聚类与排名:通过空间截断将不同化学类型的探针进行聚类,以识别多探针对接的结合热点区域。
- 🌐 基于 pyCHARMM 的探针映射框架:该框架可集成到后续的工作流程步骤中,为实验方法提供了一个计算上的类比。
- 🚀 独立程序的集成:与现有的探针映射网络服务器不同,该程序可以集成到高通量工作流程中。
- 🔍 结合面映射的方法:使用胰蛋白酶弹性酶作为模型酶,展示了计算和实验上映射蛋白质结合面的方法。
在 FASTDock 工作流程中,探针聚类与排名阶段是关键的一步。研究者通过将不同化学类型的探针基于空间截断进行聚类,识别出那些有多个探针对接的结合热点区域。这一过程不仅有助于识别关键的结合位点,也为后续的筛选提供了重要的参考信息。
此外,研究者建立了一个基于 pyCHARMM 的探针映射框架,这一框架不仅能够模拟实验方法,还能被集成到 FASTDock 的后续步骤中。这种方法的优势在于其可以独立于其他软件独立运行,使其能够轻松地集成到高通量的工作流程中,这是目前存在的网络服务式探针映射方法所无法比拟的。
针对胰蛋白酶弹性酶的研究表明,结合面映射方法有效地复现了实验上识别的所有结合位点。这一发现不仅证实了该方法的有效性,也为后续的虚拟筛选提供了坚实的基础。通过对不同受体数据集进行 MACCS 筛选,作者进一步展示了该方法在区分结合者和非结合者方面的高效性。
结论
本研究提出了一种新型的高通量筛选管道,专门用于从庞大的小分子库中迅速而有效地挑选出具有选择性和高效能的结合物。
由于变构调控在整个蛋白质组中普遍存在,深入研究变构调控对于理解生物机制和开发新药极为关键。然而,识别变构位点仍然具有挑战性。这些位点通常隐蔽,缺乏明显的几何或化学特征。此外,与正构位点相比,新的变构位点的早期引导分子更难生成,因为通常缺乏关于哪类分子可在该位点结合的信息。随着超大型小分子库的出现,通过粗力法(例如对接)在化学空间进行搜索变得不切实际。因此,迫切需要一种快速、高通量的工作流程,能够从大型小分子库中高效筛选出选择性和高效的结合物。
本研究阐述了一种新型高通量筛选管道,它包括三个独特部分:位点探测的探针映射、指纹筛选和刚性受体对接。研究者展示了探针映射技术能够复现所有实验已知的结合位点。此外,他们的排名方法能够优先考虑三分之二的实验识别位点,而不是其他计算映射的位点。通过靶标配体数据库的指纹筛选预过滤,在刚性对接步骤中实现了早期富集增加,同时还能在保持稳健结果的同时减少需要对接的分子数量。鉴于配体对接步骤是典型引导发现管道中最计算密集的部分,本研究所述工作流程有望降低计算成本,并由于计算资源需求的减少,使虚拟筛选更易于实现。此外,这一工作流程可以丰富变构和隐蔽位点的发现,因为它能处理给定靶标的多种构象,从而提供蛋白质结合景观的更完整画面。在寻找结合于新变构位点的引导化合物时,本文介绍的管道提供了一种从大型小分子库中识别选择性和高效结合物的有效方法。
缺点:
- 验证和基准测试:
- 使用已知异位位点进行的验证可能不足以证明流程发现新异位位点的能力。
- 对流程在不同蛋白质中有效性的展示有限,可能引发关于其普适性的疑问。
- 技术关注:
- 论文未充分讨论流程的计算效率和可扩展性,这对于大规模应用至关重要。
- 缺乏与现有方法的比较,这对于确立 FASTDock 的优越性或独特性是必要的。
- 方法学限制:
- 探针选择标准及其化学多样性对结果的影响未清晰论证。
- 论文未讨论流程如何处理蛋白质的柔性,这是异位位点预测中的一个关键因素。
改进建议:
-
增强验证:
- 在更广泛的蛋白质上进行额外的验证研究,以展示流程的普适性。
- 包括与现有异位位点预测方法的比较研究,以建立 FASTDock 的相对性能。
-
解决方法学差距:
- 对探针选择过程及其对最终结果的影响提供更详细的说明。
- 讨论流程如何考虑蛋白质的柔性,这对于准确的异位位点预测至关重要。
-
技术优化:
- 提供关于计算效率和潜在扩展性挑战的见解,以及可能的解决方案。
- 提供详细的技术设置和使用参数的补充材料,以助于可重复性和后续研究。
参考资料:
-
Ahmed, F., & Brooks, C. (2023). FASTDock: A Pipeline for Allosteric Drug Discovery. https://doi.org/10.26434/chemrxiv-2023-7c43h
-
Data and code: https://github.com/BrooksResearchGroup-UM/FASTDock.
-
文献下载(复制链接到外部浏览器打开): https://is.gd/ETlAnm
共有 0 条评论