Крупномасштабное предсказание биологической активности с использованием системы Active-IT
Алмейда В.Л.1, дос Сантос О.Д.Х.2, Лопес Х.С.Д.3
1. Chemoinformatics Group — NEQUIM, Departamento de Quimica, Instituto de Ciências Exatas, Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, Brazil; Servico de Fitoquimica e Prospeccao Farmaceutica, Fundacao Ezequiel Dias (FUNED), Belo Horizonte, Brazil 2. Departamento de Farmacia, Escola de Farmacia, Universidade Federal de Ouro Preto (UFOP), Brazil 3. Chemoinformatics Group — NEQUIM, Departamento de Quimica, Instituto de Ciências Exatas, Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, Brazil
Традиционные методы тестирования при разработке новых фармацевтических препаратов являются трудоёмкими и дорогими, однако инструменты in silico оценки могут помочь в решении этой проблемы. Система Active-IT — “инструмент” для проведения виртуального скрининга на основе структуры лигандов, который был разработан нами для предсказания биологической активности малых органических молекул. Включает в себя четыре независимых модуля: модуль генерации молекулярных дескрипторов (3D-Pharma); модуль машинного обучения (ExCVBA); базу данных о биологических активностях; модуль предсказания. Данные о биологических активностях были получены из базы данных PubChem BioAssay. Для построения моделей машинного обучения использованы метод опорных векторов и наивный байесовский классификатор. Модели были сконструированы с использованием случайного рекурсивного стратифицированного разбиения, их валидацию проводили путём рандомизации данных по активности (Y-random). Были построены модели для 3500 биологических тест-систем, каждая из которых состоит из: (i) 30 моделей, построенных с использованием метода опорных векторов; (ii) 30 моделей, построенных по наивному байесовскому алгоритму; (iii) 60 рандомизированных моделей для валидации. Биологические тест-системы, обладающие низкой производительностью или невысокой дискриминационной способностью, были исключены. С использованием системы Active-IT в данной работе была проведена оценка трёх биоактивных компонентов чая Аяуаска. Прогнозы были проверены с использованием известных мишеней, описанных в нескольких общедоступных базах данных. Результаты внешней валидации показали, что 16 из 33 (48,5%, p<0,0001) известных мишеней были предсказаны верно. Такой уровень точности при крупномасштабном виртуальном скрининге является удовлетворительным, и демонстрирует эффективность методологии Active-IT в прогнозировании биологической активности для малых органических молекул.
Загрузить PDF:
Ключевые слова: виртуальный скрининг на основе структуры лигандов, предсказание биологической активности, машинное обучение, случайное рекурсивное стратифицированное разбиение, фармакофорные фингерпринты, 3D молекулярные структуры
Цитирование:
Алмейда В.Л., дос Сантос О.Д.Х., Лопес Х.С.Д. (2024) Крупномасштабное предсказание биологической активности с использованием системы Active-IT. Биомедицинская химия, 70(6), 435-441.
Алмейда В.Л. и др. Крупномасштабное предсказание биологической активности с использованием системы Active-IT // Биомедицинская химия. - 2024. - Т. 70. -N 6. - С. 435-441.
Алмейда В.Л. и др., "Крупномасштабное предсказание биологической активности с использованием системы Active-IT." Биомедицинская химия 70.6 (2024): 435-441.
Алмейда, В. Л., дос, Сантос, О. Д. Х., Лопес, Х. С. Д. (2024). Крупномасштабное предсказание биологической активности с использованием системы Active-IT. Биомедицинская химия, 70(6), 435-441.
Список литературы
Rocha M.P., Campana P.R.V., Scoaris D.O., Almeida V.L., Lopes J.C.D., Shaw J.M.H., Silva C.G. (2018) Combined in vitro studies and in silico target fishing for the evaluation of the biological activities of Diphylleia cymosa and Podophyllum hexandrum. Molecules (Basel), 23(12), 3303. CrossRef Scholar google search
Rocha M.P., Campana P.R.V., Scoaris D.O., Almeida V.L., Lopes J.C.D., Silva F.A., Pieters L., Silva G.C. (2018) Biological activities of extracts from Aspidosperma subincanum Mart. and in silico prediction for inhibition of acetylcholinesterase. Phytother. Res., 32(10), 2021–2033. CrossRef Scholar google search
Briñez-Ortega E., Almeida V.L., Lopes J.C.D., Burgos A.E. (2020) Partial inclusion of bis(1,10-phenanthroline)silver(I) salicylate in β-cyclodextrin: Spectroscopic characterization, in vitro and in silico antimicrobial evaluation. Anais da Academia Brasileira de Ciências, 92(3), e20181323. CrossRef Scholar google search
da Silva R.G., Almeida T.C., Reis A.C.C., Filho S.A.V., Brandão G.C., da Silva G.N., de Sousa H.C., de Almeida V.L., Lopes J.C.D., de Souza G.H.B. (2021) In silico pharmacological prediction and cytotoxicity of flavonoids glycosides identified by UPLC-DAD-ESI-MS/MS in extracts of Humulus lupulus leaves cultivated in Brazil. Nat. Prod. Res., 35(24), 5918–5923. CrossRef Scholar google search
Sudan C.R.C., Pereira L.C., Silva A.F., Moreira C.P.S., de Oliveira D.S., Faria G., dos Santos J.S.C., Leclercq S.Y., Caldas S., Silva C.G., Lopes J.C.D., de Almeida V.L. (2021) Biological activities of extracts from Ageratum fastigiatum: Phytochemical study and in silico target fishing approach. Planta Medica, 87(12–13), 1045–1060. CrossRef Scholar google search
Axen S.D., Huang X.P., Cáceres E.L., Gendelev L., Roth B.L., Keiser M.J. (2017) A simple representation of three-dimensional molecular structure. J. Med. Chem., 60(17), 7393–7409. CrossRef Scholar google search
Gonçalves J., Luís Â., Gallardo E., Duarte A.P. (2023) A systematic review on the therapeutic effects of Ayahuasca. Plants, 12(13), 2573. CrossRef Scholar google search
Pires A.P., de Oliveira C.D., Moura S., Dörr F.A., Silva W.A., Yonamine M. (2009) Gas chromatographic analysis of dimethyltryptamine and beta-carboline alkaloids in Ayahuasca, an Amazonian psychoactive plant beverage. Phytochem. Anal., 20(2), 149–153. CrossRef Scholar google search
Callaway J.C., McKenna D.J., Grob C.S., Brito G.S., Raymon L.P., Poland R.E., Andrade E.N., Andrade E.O., Mash D.C. (1999) Pharmacokinetics of Hoasca alkaloids in healthy humans. J. Ethnopharmacology, 65(3), 243–256. CrossRef Scholar google search
Domingues B.F., Martins-José A., Lopes J.C.D. (2024) 3D-Pharma, a ligand-based virtual screening tool using 3D pharmacophore fingerprints. ChemRxiv (Preprint), 2024, DOI: 10.26434/chemrxiv-2024-dkvf8. CrossRef Scholar google search
Sud M. (2016) Mayachemtools: An open source package for computational drug discovery. J. Chem. Inf. Model., 56(12), 2292–2297. CrossRef Scholar google search
Abrahamian E., Fox P.C., Naerum L., Christensen I.T., Thøgersen H., Clark R.D. (2003) Efficient generation, storage, and manipulation of fully flexible pharmacophore multiplets and their use in 3-D similarity searching. J. Chem. Inf. Comput. Sci., 43(2), 458–468. CrossRef Scholar google search
Shemetulskis N.E., Weininger D., Blankley C.J., Yang J.J., Humblet C. (1996) Stigmata: An algorithm to determine structural commonalities in diverse datasets. J. Chem. Inf. Comput. Sci., 36(4), 862–871. CrossRef Scholar google search
Domingues B.F., Lopes J.C.D. (2012) 3D-Pharma: Uma Ferramenta para Triagem Virtual Baseada em Fingerprints de Farmacyforos. [Doctoral dissertation, Universidade Federal de Minas Gerais]. UFMG Institutional Repository. (in Portuguese) Retrieved September 29, 2024 from: http://hdl.handle.net/1843/BUBD-9DKHDA. Scholar google search
Kim S., Chen J., Cheng T., Gindulyte A., He J., He S., Li Q.,Shoemaker B.A., Thiessen P.A., Yu B., Zaslavsky L., Zhang J., Bolton E.E. (2023) PubChem 2023 update. Nucleic Acids Res., 51(D1), D1373–D1380. CrossRef Scholar google search
Kim S., Bolton E.E. (2024) PubChem: A Large-Scale Public Chemical Database For Drug Discovery. In: Open Access Databases and Datasets for Drug Discovery (Daina A., Przewosny M., Zoete V., eds.). pp. 39–66. CrossRef Scholar google search
Bolton E.E., Chen J., Kim S., Han L., He S., Shi W., Simonyan V., Sun Y., Thiessen P.A., Wang J., Yu B., Zhang J., Bryant S.H. (2011) PubChem3D: A new resource for scientists. J. Cheminformatics, 3(1), 32. CrossRef Scholar google search
Santos F.M., de Winter H., Augustyns K., Lopes J.C.D. (2015) Use of extensive cross-validation and bootstrap application (ExCVBA) for molecular modeling of some pharmacokinetics properties. Poster presented at OPENTOX EURO 2015 — OpenTox InterAction Meeting — Innovation in Predictive Toxicology, Dublin, Ireland. CrossRef Scholar google search
Chang C., Lin C. (2011) LIBSVM: A library for support vector machines. ACM Trans. Intell. Syst. Technol., 2(3), 27. CrossRef Scholar google search
Williams K. (2004) Naïve Bayes algorithm at comprehensive perl archive network. Retrieved September 29, 2024 from: https://metacpan.org/pod/Algorithm::NaiveBayes. Scholar google search
Tropsha A. (2010) Best practices for QSAR model development, validation, and exploitation. Mol. Inform., 29(6–7), 476–488. CrossRef Scholar google search
Lopes J.C.D., dos Santos F.M., Martins-José A., Augustyns K., de Winter H. (2017) The power metric: A new statistically robust enrichment-type metric for virtual screening applications with early recovery capability. J. Cheminformatics, 9, 7. CrossRef Scholar google search
de Winter H., Lopes J.C.D. (2018) Reply to the comment made by Šicho, Vorśilák and Svozil on “The power metric: A new statistically robust enrichment-type metric for virtual screening applications with early recovery capability”. J. Cheminformatics, 10, 14. CrossRef Scholar google search
Hawkins P.C., Nicholls A. (2012) Conformer generation with OMEGA: Learning from the data set and the analysis of failures. J. Chem. Inf. Model., 52(11), 2919–2936. CrossRef Scholar google search
Filimonov D.A., Lagunin A.A., Gloriozova T.A., Rudik A.V., Druzhilovskii D.S., Pogodin P.V., Poroikov V.V. (2014) Prediction of the biological activity spectra of organic compounds using the PASS online web resource. Chem. Heterocycl. Compd., 50(3), 444–457. CrossRef Scholar google search
Nicholls A. (2014) Confidence limits, error bars and method comparison in molecular modeling. Part 1: The calculation of confidence intervals. J. Comput.-Aided Mol. Des., 28(9), 887–918. CrossRef Scholar google search