| Processo: | 16/12489-2 |
| Modalidade de apoio: | Bolsas no Brasil - Mestrado |
| Data de Início da vigência: | 01 de janeiro de 2017 |
| Data de Término da vigência: | 31 de agosto de 2018 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Acordo de Cooperação: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) |
| Pesquisador responsável: | Ricardo Cerri |
| Beneficiário: | Felipe Kenji Nakano |
| Instituição Sede: | Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil |
| Bolsa(s) vinculada(s): | 17/19264-9 - Active learning para classificação hierárquica de elementos transponíveis, BE.EP.MS |
| Assunto(s): | Aprendizado computacional Biologia computacional |
| Palavra(s)-Chave do Pesquisador: | Aprendizado de Máquina | bioinformática | Deep Learning | Elementos Tranponíveis | Aprendizado de Máquina |
Resumo Elementos Transpon1veis (TEs) são sequências de DNA que podem se mover de um local para outrodentro do genoma de uma célula. Eles contribuem para a diversidade genética das espécies, e seus mecanismos de transposição podem afetar a funcionalidade dos genes. A correta identificação e classificação de TEs é útil para a compreensão de seus efeitos nos genomas. Geralmente, a identificação e classificação de TEs é realizada por meio de ferramentas que utilizam homologia, comparando uma sequência com várias sequências de um conjunto de dados com TEs já identificados. Esse método é limitado, pois a homologia ignora as propriedades bioqu1micas das sequências, e também os relacionamentos entre as diferentes classes de TEs. Como existem propostas na literatura para organizar os TEs em uma taxonomia hierárquica,com superclasses e subclasses, este projeto tem como objetivo a investigação de novos métodos de classificação hierárquica de TEs utilizando Aprendizado de Máquina (AM), considerando os relacionamentos hierárquicos entre suas classes. Mais especificamente, serão investigadas redes neurais treinadas utilizando conceitos de Deep Learning. Inicialmente, diferentes conjuntos de dados serão constru1dos com sequências já com TEs previamente identificados. Para a construção desses conjuntos, serão utilizadas ferramentas de Bioinformática desenvolvidas para detectar a presença de assinaturas em sequências, e também para extrair caracter1sticas bioqu1micas de sequências. Além disso, serão utilizadas diferentes estratégias para conversão de sequências em valores de atributos adequados para a utilização em técnicas de AM. Os conjuntos de dados serão, então, estruturados hierarquicamente, de acordo com as fam1lias e superfam1lias de TEs a que pertencem. Os métodos de classificação propostos serão comparados com métodos existentes na literatura, e avaliados por meio de medidas de avaliação espec1ficas para problemas de classificação hierárquica. (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |