ProBiS-Fold: AlphaFold 在成药性结合位点预测方面的应用


导读

利用 ProBiS-Fold 算法,研究者们在 AlphaFold 数据库中对那些未在 PDB 收录的人类蛋白质结构进行了详细的注释,以探索新的药物结合位点。ProBiS-Fold 网站运用 ProBiS(蛋白质结合位点)算法,这是一种基于局部结构比较的方法。该方法通过将 AlphaFold 预测的蛋白质结构与 PDB 中的相应结构对比,识别出 PDB 已知结合位点与 AlphaFold 数据库中未知结合位点之间的相似性。

此后,研究者将类似 PDB 位点的配体转移到 AlphaFold 数据库的蛋白质上,并将结合位点定义为配体集群。他们还基于配体与已知药物的相似性,对小分子结合位点进行药物适应度评分,按照其在药物开发中的潜在价值和实际潜力进行排序。ProBiS-Fold 为整个人类蛋白组提供了交互式和可下载的结合位点信息,其中包括 3000 多个在 PDB 中无对应结构的新药物结合位点。该网站还考虑了 AlphaFold 模型的质量,以促进蛋白质结构和功能关系研究以及药物研发。

ProBiS-Fold 的设计与实施

ProBiS 工具的演变

ProBiS-Fold 是 ProBiS-Dock 数据库和其他 ProBiS 方法的发展。它整合了 AlphaFold 完整的人类蛋白组结构,并引入了一种新的配体类型——肽类,扩展了传统的小分子焦点。

关键特性

  • 全面的配体类型:除了小分子,ProBiS-Fold 还包括蛋白质、肽类、核酸、金属离子和特定的翻译后修饰位点。
  • AlphaFold 集成:使用 AlphaFold 数据库结构,以提高准确性和范围。

预测结合位点和配体

利用蛋白质局部结构相似性

  • ProBiS 算法:识别具有相似表面模式的模板蛋白,增强结合位点的预测。
  • 局部比较:与全局比对不同,ProBiS-Fold 进行整个蛋白质结构的局部比较,使得在具有不同全局折叠的蛋白质中发现相似结合位点成为可能。

图论

  • 蛋白质图:表面氨基酸以图的形式表示,允许进行详细的比较和对齐。
  • 最大基团法:该方法对齐顶点数量最多的部分,精确定位最可能的结合位点。

ProBiS-Fold 中的配体分类

  • 多样化的配体类型:从小分子到核酸和金属离子不等。
  • 新的肽类配体类型:将肽类与蛋白质区分开,将肽类视为新兴的药物类别。

药物适应性评估

  • Sbsite 评分:一种复杂的评分系统,根据配体的复杂性和占据情况评估小分子结合位点的药物适应性。
  • 结合位点排名:有助于药物开发目的的优先排序。

ProBiS-Fold 网络服务器

  • 用户友好输入:接受各种标识符,如 AlphaFold ID 和 UniProt ID。
  • 全面输出:详细说明结合位点的中心点、边界框和蛋白质残基。

全面的数据库和药物发现应用

  • 庞大的数据库:包括超过 172,410 个预测的各类结合位点。
  • 新药靶点识别:识别出大量高度适合药物开发的新结合位点,为药物发现提供新机遇。

重要结果及图表

本文介绍了 Sbsite 评分在药物筛选中的作用,以及 ProBiS-Fold 在蛋白质结构和配体结合点预测中的应用。

Sbsite 评分特别擅长区分哪些蛋白质结合点适合用于药物开发。通过分析美国食品和药品管理局(FDA)批准的药物,研究者发现,对于 4475 种 FDA 批准药物的结合点预测中,约 25.1%的结合点包含已知药物。值得注意的是,当 Sbsite 评分超过 90 的高潜力药用结合点,这一比例增至 31.9%。这一发现突显了 Sbsite 评分在识别现有和潜在药物结合点方面的有效性。

ProBiS-Fold 的实用性在于预测蛋白质结构和配体结合点。以一种潜在的非功能性免疫球蛋白为例,ProBiS-Fold 成功预测了三个蛋白质结合点和两个小分子结合点。其中,对一种肽类配体的预测揭示了其与抗癌药西妥昔单抗的非共价相互作用,这一发现对癌症治疗的药理学研究具有重要意义。此外,ProBiS-Fold 还预测了一些具有潜在药用价值的小分子结合点,例如 Sbsite 评分为 18 的结合点,这或许有助于稳定淀粉样变性疾病中的蛋白质天然二聚体结构。

图表 1:ProBiS 药物设计方法示意图

图表 1 展示了本文中开发的ProBiS-Fold方法在药物设计中的应用。该图以粗体线条标注了ProBiS-Fold方法的特点。

图表 2:ProBiS-Fold 网站上预测的配体类型构成

图描述了ProBiS-Fold**网站对不同配体类型结合位点的预测结果。

图表 3:ProBiS-Fold 网站上小分子的新药靶点及非药靶点

小分子结合位点涵盖 PDB 中已知或未知的化合物和辅因子。药物靶向性根据计算得出的 Sbsite 值划分,该值考虑了结合配体的数量与分子复杂性。结合位点是否存在于 PDB 中,通过 UniProt 标识符和 SIFTS 转换表(UniProt 至 PDB)确定。

图表 4:ProBiS-Fold 网站上新药靶点的小分子结合位点信心水平

结合位点信心根据 AlphaFold 模型的信心分值中构成结合位点原子的最小值确定。信心水平的划分参考了文献 [1]。

图表 5:PDB 中未包含的新结合位点数量与 AlphaFold 模型信心水平的关系

这些数据与图表 4 中的信心水平定义相同。

图表 6:AlphaFold 预测的蛋白质上的肽结合位点及预测配体肽

AlphaFold 预测的蛋白质上的肽结合位点(浅蓝色表面)及其预测的配体肽,meditope(CPK 棍模型)。

图表 7:预测的小分子化合物配体 - 香豆素衍生物及其结合位点

图 8:预测的蛋白质结合位点与配体

图 8 展示了预测的蛋白质结合位点(蓝色表面)和蛋白质配体(灰色卡通模型)。蛋白质配体是重变量链(ID: 4KTD),结合在可能的非功能性免疫球蛋白 lambda 变异 11-55(蓝色卡通模型,UniProt ID 为 A0A075B6I3)上。这一结构由 AlphaFold 预测,但在 PDB 中尚无实验结构。结合位点由残基组成,形成类似于抗体中二聚体相互作用的 β-折叠。

图 9:预测的糖链配体与结合位点

图 9 展示了预测的糖链配体与结合位点。糖链配体通过 O-糖苷键与查询蛋白的苏氨酸 46 结合。查询蛋白是可能的非功能性免疫球蛋白 lambda 变异 11-55,由 AlphaFold 方法预测,PDB 中尚无实验结构。另一结构,HIV 的 PG9 抗体轻链(粉红色卡通模型,PDB ID 为 4YAQ),被 ProBiS 算法识别为在糖链结合位点区域与查询蛋白结构相似。

图 10:预测的保守水配体与结合位点

保守的水位于查询蛋白(蓝色卡通模型)的预测结合位点(白色表面)。该蛋白为 N-脂肪酰氨基酸合成酶/水解酶 pm20d1(UniProt ID: Q6GTS8),目前未收录于 PDB 中。

比较分析

本文介绍的这种新型蛋白质结构比较分析方法采用了覆盖整个人类蛋白质组的 AlphaFold 蛋白结构,并特别关注于将配体细分为肽类。与 ProBiS-Dock 数据库相比,ProBiS-Fold 网络服务的特色在于,它不仅包括了小分子的结合位点,还涵盖了蛋白质、肽、核酸、金属离子、保守水分子和糖基化位点等多种配体类型。文章还提及,通过应用最大基团顶点对齐法,作者能够叠加表面斑块,并按照先前在 ProBiS-ligands 网络服务中描述的方法,对转移到查询蛋白的配体进行分类。

关于 cetuximab 的特异性,研究指出它只与 meditope 结合,而不与其他人类免疫球蛋白发生作用,从而减少了潜在副作用。但是,该网络服务发现,meditope 可能还能与其他人类蛋白质相结合,尤其是潜在的非功能性免疫球蛋白 lambda 变异体 11-55。通过这种分析,作者观察到查询蛋白的天冬氨酸 112 与 meditope 的精氨酸 9 的鸟嘌呤基团之间存在氢键相互作用,这一发现与先前关于 meditope 对 cetuximab 特异性的研究结果一致。

结论

  • 🧬 该网站基于 Protein Data Bank(PDB)和 AlphaFold 数据库的数据,利用 ProBiS 方法有效识别蛋白质活性位点,为新药发现提供支持。
  • 💻 ProBiS-Fold 网站能够预测人类结构蛋白质库中的 172,410 个结合位点,其中包括 3006 个新发现的小分子药物结合位点。
  • 🔬 该网站还首次使用 AlphaFold 数据库数据,允许研究者检查 PDB 中无对应结构的蛋白质,进而预测其结合位点及其在药物开发中的潜在应用。

ProBiS 方法和相应的数据库是基于 PDB 和 AlphaFold 数据库中的蛋白质结构信息预先计算而成的。研究者应用 ProBiS 方法来探测和解释蛋白质的活性位点,这对新药发现、药物重新定位,以及预测已知药物与次要靶标或可能导致不良副作用的非靶标之间的相互作用非常有价值。

新开发的 ProBiS-Fold 网络服务器包含人类结构蛋白质库中 172,410 个预测的结合位点。其中 3006 个是新的、可药物化的小分子结合位点,它们的蛋白质结构尚未通过实验确定。除了小分子结合位点,该服务器还提供蛋白质-蛋白质、蛋白质-肽、蛋白质-核酸、蛋白质-水、蛋白质-金属离子结合位点以及 O-和 N-糖基化位点的预测。服务器基于 ProBiS 方法和 AlphaFold 数据库的数据开发,后者包含超过 24,000 种人类蛋白质的模型单体结构。

ProBiS-Fold 网络服务器使得研究人员能够首次检查 AlphaFold 数据库中没有对应 PDB 结构的蛋白质,详细预测结合位点的位置、与哪些配体结合以及这些结合位点是否适合药物开发。这一工具不仅在蛋白质科学和基因组学领域发挥作用,也对一般生物学和医学领域的研究提供了卓越的服务。

缺点:

  • 数据的验证和可靠性
    • 需要更严格的验证 ProBiS-Fold 预测与实验数据的一致性,以建立可靠性。
    • 预测的结合位点与其实际药用性之间的相关性需要进一步的实验支持。
  • 技术和方法论的局限性
    • 可以更好地讨论使用 AlphaFold 预测的局限性,这些预测可能并不总是与实际的实验数据一致。
    • ProBiS 算法或所使用的数据集中可能存在的偏见可能会影响研究结果;需要进一步探索这些方面。

改进建议

  • 加强验证方法

    • 可以适当收录和更新有关结合额外的验证研究比较 ProBiS-Fold 预测与实验数据,以加强发现的可靠性。
    • 考虑与其他数据库或预测方法的交叉验证,以基准测试 ProBiS-Fold 的准确性和效率。
  • 技术改进

    • 调查和讨论所使用的数据集和算法中可能存在的偏见,并提出减轻这些偏见的方法。
    • 探索将 ProBiS-Fold 与其他计算工具或数据库集成,以提高其效用和准确性。

参考资料:

  • Konc, J., & Janežič, D. (2022). ProBiS-Fold Approach for Annotation of Human Structures from the AlphaFold Database with No Corresponding Structure in the PDB to Discover New Druggable Binding Sites. Journal of Chemical Information and Modeling, 62(22), 5821–5829. https://doi.org/10.1021/acs.jcim.2c00947

  • 文献下载(复制链接到外部浏览器打开): https://is.gd/LY6SBw

版权声明:
作者:玉兰
链接:https://www.techfm.club/p/90066.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>