27º Congresso Brasileiro de Microbiologia
Resumo:1393-1


Poster (Painel)
1393-1ANÁLISE FILOGENÉTICA DE BACTÉRIAS BASEADA NA DECOMPOSIÇÃO POR VALORES SINGULARES DE FREQUÊNCIAS DE PADRÕES DE ASSINATURA GENÔMICA
Autores:Amorim, L.G. (UFMG - Universidade Federal de Minas Gerais) ; Mariano, D. C. B. (UFMG - Universidade Federal de Minas Gerais) ; Castro-Oliveira, L. (UFMG - Universidade Federal de Minas Gerais) ; Santos, M. A. (UFMG - Universidade Federal de Minas Gerais) ; Soares, S. C. (UFMG - Universidade Federal de Minas Gerais) ; Miyoshi, A. (UFMG - Universidade Federal de Minas Gerais) ; Azevedo, V. (UFMG - Universidade Federal de Minas Gerais)

Resumo

Com o surgimento das técnicas moleculares, foi possível aperfeiçoar as análises filogenéticas por meio da utilização de padrões específicos que constituem a assinatura genômica, tais como: conteúdo G+C; preferência de códon; e padrões de di-, tri- e tetra-nucleotídeos. Neste contexto, o padrão de uso de códon é afetado pela força de ligação códon/anticódon e maior disponibilidade de determinado gene de tRNA, sendo que a adoção de códons preferenciais ricos em G+T ou A+C leva a um padrão de conteúdo G+C homogêneo no genoma que é diferente entre organismos não relacionados. Neste trabalho, foram utilizados diversos microrganismos como estudo de caso focando naqueles pertencentes ao grupo CMNR – composto por bactérias dos gêneros Corynebacterium, Mycobacterium, Nocardia e Rhodococcus – que possuem alto conteúdo G+C no genoma e relação filogenética descrita na literatura. Assim, este trabalho tem como objetivos a construção de matrizes e árvores filogenéticas utilizando o padrão de uso de códon de diferentes bactérias. Para isso, primeiramente, foi criado um script que gerou uma matriz baseada em frações de códons, à qual serão somadas outras matrizes. Estas, por sua vez, serão baseadas em: (i) frações de códons e conteúdo G+C; (ii) frações de códons, conteúdo G+C e di-nucleotídeos; (iii) frações de códons, conteúdo G+C, di- e tri-nucleotídeos; (iv) frações de códons, conteúdo G+C, di-, tri- e tetra-nucleotídeos. Ademais, a matriz criada com o padrão de uso de códon foi decompostas em valores singulares (SVD – do inglês, Singular Value Decomposition) através do uso do programa MATLAB®, plotada em um gráfico tri-dimensional e as distâncias foram utilizadas para gerar uma matriz de distâncias para a criação de uma árvore filogenética. Dessa maneira, a árvore obtida nas análises preliminares mostra uma relação clara entre as bactérias do grupo CMNR, com um pequeno número de espécies em desacordo. Entretanto, espera-se que o acréscimo das frequências de nucleotídeos (G+C; di-, tri- e tetra-nucleotídeos) traga uma maior precisão ao método, visto que os organismos em desacordo apresentam grandes diferenças em suas composições de conteúdo G+C em relação ao grupo CMNR. Finalmente, a metodologia descrita será implementada em um software de acesso público para posterior análise filogenética de outros genomas bacterianos disponíveis em bancos de dados como o NCBI (do inglês, National Center for Biotechnology Information).