1. ООО “Генотек”, Москва, Россия 2. Институт общей генетики имени Н.И. Вавилова, Москва, Россия 3. Институт биологии Карельского научного центра Российской академии наук, Петрозаводск, Россия
Целью исследования была разработка и тестирование протокола для биоинформатической обработки NGS-данных для эффективного поиска мутаций в геноме солидных опухолей. Согласно разработанному протоколу на начальном этапе проводили оценку качества прочтений нуклеотидов. Нуклеотиды с качеством прочтения ниже 10 удаляли с 3¢-конца с помощью программы Cutadapt. Далее прочтения картировали на референсный геном hg19 (GRCh37.p13) с помощью программы BWA. Дедупликацию ридов выполняли специализированной программой SAMtools. Для распознавания однонуклеотидных вариантов применяли MuTect. Комплексно оценивали функциональный эффект мутаций на основе алгоритма, включающего аннотирование и оценку патогенности с помощью программного решения SnpEff, а также анализа таких баз данных, как COSMIC, dbNSFP, Clinvar, OMIM. Дополнительно для оценки эффекта на функцию кодируемого белка применяли утилиты SIFT и Poly-Phen2. Информацию о частоте мутаций получали на основе данных проектов 1000 Genomes и ExAC, а также собственной базы данных частот. Для проведения тестирования протокола был проведен анализ 18 образцов биопсии опухолей молочной железы. Секвенирование образцов проводили на платформе Illumina. Для таргетного обогащения кодирующих регионов генома использовали набор реагентов MYbaits Onconome KL v1.5 Panel (“MYcroarray,” США). По результатам биоинформатической обработки данных секвенирования обнаружено множество мутаций в генах BRCA1, BRCA2, ATM, CDH1, CHEK2, TP53, в том числе мутации-драйверы, оказывающие влияние на аминокислотную последовательность кодируемого белка. Таким образом, предлагаемый нами биоинформатический протокол позволяет эффективно выполнять автоматическую обработку NGS-данных образцов опухолей и обнаруживать мутации. Данный протокол для биоинформатической обработки данных впервые апробирован на выборке образцов опухолей из российской популяции. Для подтверждения эффективности и точности предлагаемого протокола в дальнейшем необходимо тестирование алгоритма на данных секвенирования различных форм опухолей.
Цуканов К.Ю., Красненко А.Ю., Плахина Д.А., Коростин Д.О., Чуров А.В., Дружиловская О.С., Ребриков Д.В., Ильинский В.В. (2017) Биоинформатический протокол для обработки NGS-данных и идентификации мутаций в солидных опухолях человека. Биомедицинская химия, 63(5), 413-417.
Цуканов К.Ю. и др. Биоинформатический протокол для обработки NGS-данных и идентификации мутаций в солидных опухолях человека // Биомедицинская химия. - 2017. - Т. 63. -N 5. - С. 413-417.
Цуканов К.Ю. и др., "Биоинформатический протокол для обработки NGS-данных и идентификации мутаций в солидных опухолях человека." Биомедицинская химия 63.5 (2017): 413-417.
Цуканов, К. Ю., Красненко, А. Ю., Плахина, Д. А., Коростин, Д. О., Чуров, А. В., Дружиловская, О. С., Ребриков, Д. В., Ильинский, В. В. (2017). Биоинформатический протокол для обработки NGS-данных и идентификации мутаций в солидных опухолях человека. Биомедицинская химия, 63(5), 413-417.
Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N. et al. (2009) Bioinformatics, 25, 2078-2079. CrossRef Scholar google search
Cibulskis K., Lawrence M.S., Carter S.L., Sivachenko A.,Jaffe D., Sougnez C. et al. (2013) Nat. Biotechnol., 31, 213-219. CrossRef Scholar google search
Cingolani P., Platts A., Wang le L., Coon M., Nguyen T., Wang L., Land S.J., Lu X., Ruden D.M. (2012) Fly (Austin), 6, 80-92. CrossRef Scholar google search
Forbes S.A., Beare D., Bindal N., Bamford S., Ward S., Cole C.G. et al. (2016) Curr. Protoc. Hum. Genet., 91, 10.11.1-10.11.37. CrossRef Scholar google search