Busca avançada
Ano de início
Entree

Classificação hierárquica de elementos transponíveis e funções de proteínas utilizando aprendizado de máquina

Processo: 16/25078-0
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de março de 2017
Vigência (Término): 30 de junho de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Bruna Zamith Santos
Instituição-sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):17/13218-5 - Predição de funções de proteínas via predição de interações, BE.EP.IC
Assunto(s):Aprendizado computacional   Biologia computacional   Elementos de DNA transponíveis

Resumo

Proteínas são macromoléculas responsáveis por praticamente toda tarefa necessária à manutenção das células, tendo papel fundamental para o funcionamento e regulação dos organismos. Os avanços na área de Biologia Molecular permitiram uma listagem quase completa de proteínas que compõem os organismos. Todavia, existe uma grande quantidade de proteínas cuja função ainda é desconhecida, abrindo espaço para um novo foco de pesquisas em Biologia Molecular. Paralelamente, Elementos Transponíveis (TEs) são sequências de DNA que têm a capacidade de se mover dentro do genoma das células, alterando a atividade de determinados genes. Quando os TEs se inserem em outros genes, podem alterar ou reduzir a atividade de determinadas proteínas, inviabilizando, em alguns casos, a sobrevivência do organismo; ou, em outras situações, proporcionando variabilidade genética. Dada a necessidade da correta identificação e classificação de TEs e de funções de proteínas, existem diversas técnicas atualmente empregadas para se atingir este objetivo. As principais envolvem muito trabalho manual ou então são muito específicas, restringindo o conjunto de dados a ser classificado. Ainda, as classes envolvidas nesses problemas são estruturadas hierarquicamente, fato muitas vezes ignorado pelas técnicas propostas. Assim, este projeto propõe a utilização de Aprendizado de Máquina (AM) para a classificação hierárquica de TEs e de funções de proteínas. Além da utilização de vários métodos da literatura, uma nova contribuição será a investigação de diferentes maneiras de se utilizar exemplos positivos e negativos durante a indução de métodos hierárquicos. Isso é especialmente importante em métodos que seguem a estratégia de classificação top-down. Todos os métodos serão avaliados utilizando medidas específicas para problemas hierárquicos. (AU)