Busca avançada
Ano de início
Entree

Predição de funções de proteínas via predição de interações

Processo: 17/13218-5
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Iniciação Científica
Vigência (Início): 01 de setembro de 2017
Vigência (Término): 31 de dezembro de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Bruna Zamith Santos
Supervisor no Exterior: Celine Vens
Instituição-sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Local de pesquisa : University of Leuven, Kulak Kortrijk (KU Leuven), Bélgica  
Vinculado à bolsa:16/25078-0 - Classificação hierárquica de elementos transponíveis e funções de proteínas utilizando aprendizado de máquina, BP.IC
Assunto(s):Aprendizado computacional   Biologia computacional   Biologia molecular   Proteínas

Resumo

Proteínas são macromoléculas responsáveis por praticamente toda tarefa necessária à manutenção das células, tendo papel fundamental para o funcionamento e regulação dos organismos. Os avanços na área de Biologia Molecular permitiram uma listagem quase completa de proteínas que compõem os organismos. Todavia, existe uma grande quantidade de proteínas cuja função ainda é desconhecida, abrindo espaço para um novo foco de pesquisas em Biologia Molecular. Normalmente, a predição de funções de proteínas é feita usando ferramentas de Bioinformática baseadas em homologia, comparando-se a sequência com um banco de dados de várias sequências pertencentes a funções previamente conhecidas. Esta é uma estratégia limitada, uma vez que ignora as propriedades bioquímicas das sequências, e também as relações hierárquicas que podem existir entre as diferentes classes. Na literatura, o uso de Aprendizado de Máquina para predição de funções de proteínas vem se mostrando promissor, obtendo avanços significados em comparação ao uso de homologia e outros métodos convencionais. Fazendo uso de Aprendizado de Máquina, é possível modelar o problema de predição de funções de proteínas como um problema de Classificação Hierárquica Multirrótulo, devido ao fato de funções de proteínas serem hierarquicamente organizadas. Este projeto propõe a modelagem do problema de predição de funções de proteínas como um problema de classificação hierárquica multirrótulo a partir de dados interativos. Dados interativos são caracterizados por dois conjuntos de objetos, cada um descrito por atributos específicos, o que permite a previsão de interações entre duas instâncias. Mais precisamente, ampliaremos uma árvore de decisão, desenvolvida para previsão de interação, ao contexto de classificação hierárquica multirrótulo. (AU)