Bolsa 17/13218-5 - Aprendizado computacional, Biologia computacional - BV FAPESP
Busca avançada
Ano de início
Entree

Predição de funções de proteínas via predição de interações

Processo: 17/13218-5
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2017
Data de Término da vigência: 31 de dezembro de 2017
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Bruna Zamith Santos
Supervisor: Celine Vens
Instituição Sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Instituição Anfitriã: University of Leuven, Kulak Kortrijk (KU Leuven), Bélgica  
Vinculado à bolsa:16/25078-0 - Classificação hierárquica de elementos transponíveis e funções de proteínas utilizando aprendizado de máquina, BP.IC
Assunto(s):Aprendizado computacional   Biologia computacional   Biologia molecular   Proteínas
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | bioinformática | Classificação Hierárquica Multirrótulo | Dados Interativos | Funções de proteínas | Aprendizado de Máquina

Resumo

Proteínas são macromoléculas responsáveis por praticamente toda tarefa necessária à manutenção das células, tendo papel fundamental para o funcionamento e regulação dos organismos. Os avanços na área de Biologia Molecular permitiram uma listagem quase completa de proteínas que compõem os organismos. Todavia, existe uma grande quantidade de proteínas cuja função ainda é desconhecida, abrindo espaço para um novo foco de pesquisas em Biologia Molecular. Normalmente, a predição de funções de proteínas é feita usando ferramentas de Bioinformática baseadas em homologia, comparando-se a sequência com um banco de dados de várias sequências pertencentes a funções previamente conhecidas. Esta é uma estratégia limitada, uma vez que ignora as propriedades bioquímicas das sequências, e também as relações hierárquicas que podem existir entre as diferentes classes. Na literatura, o uso de Aprendizado de Máquina para predição de funções de proteínas vem se mostrando promissor, obtendo avanços significados em comparação ao uso de homologia e outros métodos convencionais. Fazendo uso de Aprendizado de Máquina, é possível modelar o problema de predição de funções de proteínas como um problema de Classificação Hierárquica Multirrótulo, devido ao fato de funções de proteínas serem hierarquicamente organizadas. Este projeto propõe a modelagem do problema de predição de funções de proteínas como um problema de classificação hierárquica multirrótulo a partir de dados interativos. Dados interativos são caracterizados por dois conjuntos de objetos, cada um descrito por atributos específicos, o que permite a previsão de interações entre duas instâncias. Mais precisamente, ampliaremos uma árvore de decisão, desenvolvida para previsão de interação, ao contexto de classificação hierárquica multirrótulo. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SANTOS, BRUNA Z.; NAKANO, FELIPE K.; CERRI, RICARDO; VENS, CELINE; HUTTER, F; KERSTING, K; LIJFFIJT, J; VALERA, I. Predictive Bi-clustering Trees for Hierarchical Multi-label Classification. MACHINE LEARNING AND KNOWLEDGE DISCOVERY IN DATABASES, ECML PKDD 2020, PT III, v. 12459, p. 18-pg., . (16/25078-0, 17/13218-5)