Busca avançada
Ano de início
Entree

Deep learning para classificação hierárquica de elementos Transponníveis

Processo: 16/12489-2
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de janeiro de 2017
Vigência (Término): 31 de agosto de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Convênio/Acordo: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Pesquisador responsável:Ricardo Cerri
Beneficiário:Felipe Kenji Nakano
Instituição-sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):17/19264-9 - Active learning para classificação hierárquica de elementos transponíveis, BE.EP.MS
Assunto(s):Aprendizado computacional   Biologia computacional

Resumo

Elementos Transpon1veis (TEs) são sequências de DNA que podem se mover de um local para outrodentro do genoma de uma célula. Eles contribuem para a diversidade genética das espécies, e seus mecanismos de transposição podem afetar a funcionalidade dos genes. A correta identificação e classificação de TEs é útil para a compreensão de seus efeitos nos genomas. Geralmente, a identificação e classificação de TEs é realizada por meio de ferramentas que utilizam homologia, comparando uma sequência com várias sequências de um conjunto de dados com TEs já identificados. Esse método é limitado, pois a homologia ignora as propriedades bioqu1micas das sequências, e também os relacionamentos entre as diferentes classes de TEs. Como existem propostas na literatura para organizar os TEs em uma taxonomia hierárquica,com superclasses e subclasses, este projeto tem como objetivo a investigação de novos métodos de classificação hierárquica de TEs utilizando Aprendizado de Máquina (AM), considerando os relacionamentos hierárquicos entre suas classes. Mais especificamente, serão investigadas redes neurais treinadas utilizando conceitos de Deep Learning. Inicialmente, diferentes conjuntos de dados serão constru1dos com sequências já com TEs previamente identificados. Para a construção desses conjuntos, serão utilizadas ferramentas de Bioinformática desenvolvidas para detectar a presença de assinaturas em sequências, e também para extrair caracter1sticas bioqu1micas de sequências. Além disso, serão utilizadas diferentes estratégias para conversão de sequências em valores de atributos adequados para a utilização em técnicas de AM. Os conjuntos de dados serão, então, estruturados hierarquicamente, de acordo com as fam1lias e superfam1lias de TEs a que pertencem. Os métodos de classificação propostos serão comparados com métodos existentes na literatura, e avaliados por meio de medidas de avaliação espec1ficas para problemas de classificação hierárquica. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
NAKANO, FELIPE KENJI; CERRI, RICARDO; VENS, CELINE. Active learning for hierarchical multi-label classification. DATA MINING AND KNOWLEDGE DISCOVERY, v. 34, n. 5, SI JUL 2020. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.