DNA-Barcoding e aprendizado de máquina no alinhamento e localização de Primers para o reconhecimento de cianobactérias / DNA-Barcoding and machine learning in the alignment and localization of Primers for the recognition of cyanobacteria

Authors

  • Victor Sanmartin
  • Rejane Frozza
  • Alexandre Rieger
  • Alexandro Cagliari

DOI:

https://doi.org/10.34117/bjdv8n4-637

Keywords:

bioinformática, dna, dna-barcoding, aprendizado de máquina, cianobactérias

Abstract

A Bioinformática é uma área que vem ganhando visibilidade para a previsão de doenças através do DNA (Ácido desoxirribonucleico). Esta área sempre esteve diretamente associada à biologia molecular, campo da biologia responsável por estudar a estrutura e as funções do material genético, bem como as proteínas, que são os resultados obtidos em uma síntese de DNA. A área da Genômica é um ramo da bioquímica que estuda o genoma completo de um organismo. Com a evolução das tecnologias de informação, torna-se possível a manipulação de um grande volume de dados e isso tem permitido que os estudiosos da área obtenham cada vez mais rapidamente seus resultados. A genômica e suas derivadas são áreas de investigação alicerçadas na geração de um grande volume dados que tem aumentado exponencialmente ao longo dos anos. As técnicas de DNA-Barcoding e Aprendizado de Máquina tendem a auxiliar ainda mais os pesquisadores da área, buscando soluções rápidas e inteligentes. Assim, este trabalho uniu as técnicas de DNA-Barcoding e Aprendizado de Máquina, com a técnica de agrupamento, cujo aprendizado é não supervisionado, para o sequenciamento e identificação de Cianobactérias. A metodologia incluiu bibliometria quantitativa e qualitativa para busca e análise de trabalhos relacionados; modelagem e desenvolvimento do sistema de sequenciamento e reconhecimento de cianobactérias; implementação do BLAST (que realiza o alinhamentos de sequência de DNA), do sequenciamento pelo DNA-Barcoding, da identificação das regiões de primers e do agrupamento das sequências; realização de testes e ajustes no sistema. A partir dos resultados obtidos, destaca-se a velocidade de execução de todo o processo, desde o BLAST inicial até o BLAST final, bem como a busca pelos Primers e o agrupamento.

References

ARAÚJO, C. A. (2006) Bibliometria: evolução histórica e questões atuais. Em Questão, Porto Alegre, v. 12, n. 1, p. 11-32.

BECKERS, B., BEECK, M. O., THIJS, S., TRUYENS, S., WEYENS, N., BOERJAN, W., VANGRONSVELD, J. Performance of 16s rDNA Primer Pairs in the Study of Rhizosphere and Endosphere Bacterial Microbiomes in MetaBarcoding Studies. Frontiers in Microbiology, 2016, v. 7, p. 1-15.

BLAST. Disponível em: https://blast.ncbi.nlm.nih.gov/Blast.cgi. Acessado em: 14/10/2020.

CORDIER, T., FORSTER, D., DUFRESNE, Y., MARTINS, C. I. M., STOECK, T., PAWLOWSKI, J. Supervised machine learning outperforms taxonomy-based environmental DNA metaBarcoding applied to biomonitoring. Molecular Ecology Resources. 2018, v. 18, p. 1381-1391.

DELONG, R. K., ZHOU, Q. Polymerase Chain Reaction (PCR). Introductory Experiments on Biomolecules and Their Interactions, 2015, 59–66.

EDGAR, R.C. MUSCLE: a multiple sequence alignment method with reduced time and space complexity. BMC Bioinformatics 5, 113. 2004.

GERHARD, W. A., GUNSCH, C. K. MetaBarcoding and machine learning analysis of environmental DNA in ballast water arriving to hub ports. Environment International, 2019, v. 124, p. 312-319.

HEBERT, P. D. N.; CYWINSKA, A.; BALL, S. L.; DEWAARD, J. R. Biological identifications through DNA barcodes. Proceedings. Royal Society Biological Sciences Meeting. 2003, v. 270, 313-321.

JAIN, Anil K.; DUBES, Richard C. Algorithms for Clustering Data. Prentice Hall. New Jersey. 1988.

KORF, Ian & YANDELL, Mark, BEDELL, Joseph. BLAST - an essential guide to the basic local alignment search tool. 2003.

KRESS, W. J., ERICKSON, D. L. DNA barcodes: genes, genomics, and bioinformatics. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105, 2761–2762.

LIBBRECHT, Maxwell W., NOBLE, William S. Machine learning in genetics and genomics. HHS Public Access, 2015, v. 16, p. 321-332.

LUSCOMBE, N. M., GREENBAUM, D., GERSTEIN, M. What is bioinformatics? A proposed definition and overview of the field. Methods Inf. Med. 2001, 40, 346-358.

MITCHELL, Tom. Machine Learning, McGraw-Hill; 1997.

NCBI, Blast. 2021. Disponível em https://blast.ncbi.nlm.nih.gov/Blast.cgi. Acessado em: 21/01/2021.

PEARSON, William. LIPMAN, David J. Improved tools for biological sequence comparison. Proceedings of the National Academy of Sciences of the United States of America. 85. 2444- 8. 1988

RAMOS, V., MORAIS, J., VASCONCELOS, V. A curated database of cyanobacterial strains relevant for modern taxonomy and phylogenetic studies. Scientific Data 4. 2017.

Published

2022-04-29

How to Cite

Sanmartin, V., Frozza, R., Rieger, A., & Cagliari, A. (2022). DNA-Barcoding e aprendizado de máquina no alinhamento e localização de Primers para o reconhecimento de cianobactérias / DNA-Barcoding and machine learning in the alignment and localization of Primers for the recognition of cyanobacteria. Brazilian Journal of Development, 8(4), 32473–32487. https://doi.org/10.34117/bjdv8n4-637

Issue

Section

Original Papers