Busca avançada
Ano de início
Entree

Classificação hierárquica de elementos transponíveis utilizando aprendizado de máquina

Processo: 15/14300-1
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de março de 2016 - 28 de fevereiro de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Ricardo Cerri
Instituição-sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Pesq. associados:André Carlos Ponce de Leon Ferreira de Carvalho ; Carlos Norberto Fischer ; Márcio Porto Basgalupp
Auxílios(s) vinculado(s):16/50457-5 - Multi-objective evolutionary methods for hierarchical and multi-label classification, AP.R
Assunto(s):Biologia computacional  Redes neurais  Inteligência artificial  Algoritmos genéticos  Classificação hierárquica  Elementos de DNA transponíveis  Genomas 

Resumo

Elementos Transponíveis (TEs) são sequências de DNA que podem se mover de um local para outro dentro do genoma de uma célula. Eles contribuem para a diversidade genética das espécies, e seus mecanismos de transposição podem afetar a funcionalidade dos genes. A correta identificação e classificação de TEs é útil para a compreensão de seus efeitos no processo evolutivo dos genomas. Os TEs são organizados em uma taxonomia hierárquica, com famílias e superfamílias. Geralmente, a identificação e classificação de TEs é realizada por meio de ferramentas de Bioinformática que utilizam homologia, comparando uma sequência com várias sequências de um conjunto de dados com TEs já identificados. Esse método apresenta limitações, pois a homologia entre sequências ignora as propriedades bioquímicas das mesmas, e também os relacionamentos hierárquicos entre as diferentes famílias e superfamílias de TEs. Assim, neste projeto, serão investigados e propostos diferentes métodos de classificação hierárquica de TEs utilizando Aprendizado de Máquina (AM). Inicialmente, diferentes conjuntos de dados serão construídos com sequências de nucleotídeos e de aminoácidos já com TEs previamente identificados. Para a construção desses conjuntos de dados, serão utilizadas ferramentas de Bioinformática desenvolvidas para extrair características bioquímicas de sequências, e também diferentes estratégias para conversão de sequências em valores de atributos adequados para a utilização em técnicas de AM. Os conjuntos de dados serão, então, estruturados hierarquicamente, de acordo com as famílias e superfamílias de TEs a que pertencem. Os métodos de classificação propostos serão comparados com métodos existentes na literatura, e avaliados por meio de medidas de avaliação específicas para problemas de classificação hierárquica. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CERRI, RICARDO; BASGALUPP, MARCIO P.; BARROS, RODRIGO C.; DE CARVALHO, ANDRE C. P. L. F. Inducing Hierarchical Multi-label Classification rules with Genetic Algorithms. APPLIED SOFT COMPUTING, v. 77, p. 584-604, APR 2019. Citações Web of Science: 1.
SCHIETGAT, LEANDER; VENS, CELINE; CERRI, RICARDO; FISCHER, CARLOS N.; COSTA, EDUARDO; RAMON, JAN; CARARETO, CLAUDIA M. A.; BLOCKEEL, HENDRIK. A machine learning based framework to identify and classify long terminal repeat retrotransposons. PLOS COMPUTATIONAL BIOLOGY, v. 14, n. 4 APR 2018. Citações Web of Science: 2.
CERRI, RICARDO; BARROS, RODRIGO C.; DE CARVALHO, ANDRE C. P. L. F.; JIN, YAOCHU. Reduction strategies for hierarchical multi-label classification in protein function prediction. BMC Bioinformatics, v. 17, SEP 15 2016. Citações Web of Science: 14.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.