Resumo
Elementos Transponíveis (TEs) são sequências de DNA que podem se mover de um local para outro dentro do genoma de uma célula. Eles contribuem para a diversidade genética das espécies, e seus mecanismos de transposição podem afetar a funcionalidade dos genes. A correta identificação e classificação de TEs é útil para a compreensão de seus efeitos no processo evolutivo dos genomas. Os TEs são organizados em uma taxonomia hierárquica, com famílias e superfamílias. Geralmente, a identificação e classificação de TEs é realizada por meio de ferramentas de Bioinformática que utilizam homologia, comparando uma sequência com várias sequências de um conjunto de dados com TEs já identificados. Esse método apresenta limitações, pois a homologia entre sequências ignora as propriedades bioquímicas das mesmas, e também os relacionamentos hierárquicos entre as diferentes famílias e superfamílias de TEs. Assim, neste projeto, serão investigados e propostos diferentes métodos de classificação hierárquica de TEs utilizando Aprendizado de Máquina (AM). Inicialmente, diferentes conjuntos de dados serão construídos com sequências de nucleotídeos e de aminoácidos já com TEs previamente identificados. Para a construção desses conjuntos de dados, serão utilizadas ferramentas de Bioinformática desenvolvidas para extrair características bioquímicas de sequências, e também diferentes estratégias para conversão de sequências em valores de atributos adequados para a utilização em técnicas de AM. Os conjuntos de dados serão, então, estruturados hierarquicamente, de acordo com as famílias e superfamílias de TEs a que pertencem. Os métodos de classificação propostos serão comparados com métodos existentes na literatura, e avaliados por meio de medidas de avaliação específicas para problemas de classificação hierárquica. (AU)
| Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio: |
| Mais itensMenos itens |
| TITULO |
| Matéria(s) publicada(s) em Outras Mídias ( ): |
| Mais itensMenos itens |
| VEICULO: TITULO (DATA) |
| VEICULO: TITULO (DATA) |