Bolsa 16/25078-0 - Aprendizado computacional, Biologia computacional - BV FAPESP
Busca avançada
Ano de início
Entree

Classificação hierárquica de elementos transponíveis e funções de proteínas utilizando aprendizado de máquina

Processo: 16/25078-0
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de março de 2017
Data de Término da vigência: 30 de junho de 2018
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Bruna Zamith Santos
Instituição Sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):17/13218-5 - Predição de funções de proteínas via predição de interações, BE.EP.IC
Assunto(s):Aprendizado computacional   Biologia computacional   Elementos de DNA transponíveis
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | bioinformática | Classificação Hierárquica | Elementos Transpoíiveis | Funções de proteínas | Bioinformática, Aprendizado de Máquina

Resumo

Proteínas são macromoléculas responsáveis por praticamente toda tarefa necessária à manutenção das células, tendo papel fundamental para o funcionamento e regulação dos organismos. Os avanços na área de Biologia Molecular permitiram uma listagem quase completa de proteínas que compõem os organismos. Todavia, existe uma grande quantidade de proteínas cuja função ainda é desconhecida, abrindo espaço para um novo foco de pesquisas em Biologia Molecular. Paralelamente, Elementos Transponíveis (TEs) são sequências de DNA que têm a capacidade de se mover dentro do genoma das células, alterando a atividade de determinados genes. Quando os TEs se inserem em outros genes, podem alterar ou reduzir a atividade de determinadas proteínas, inviabilizando, em alguns casos, a sobrevivência do organismo; ou, em outras situações, proporcionando variabilidade genética. Dada a necessidade da correta identificação e classificação de TEs e de funções de proteínas, existem diversas técnicas atualmente empregadas para se atingir este objetivo. As principais envolvem muito trabalho manual ou então são muito específicas, restringindo o conjunto de dados a ser classificado. Ainda, as classes envolvidas nesses problemas são estruturadas hierarquicamente, fato muitas vezes ignorado pelas técnicas propostas. Assim, este projeto propõe a utilização de Aprendizado de Máquina (AM) para a classificação hierárquica de TEs e de funções de proteínas. Além da utilização de vários métodos da literatura, uma nova contribuição será a investigação de diferentes maneiras de se utilizar exemplos positivos e negativos durante a indução de métodos hierárquicos. Isso é especialmente importante em métodos que seguem a estratégia de classificação top-down. Todos os métodos serão avaliados utilizando medidas específicas para problemas hierárquicos. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PEREIRA, GEAN TRINDADE; SANTOS, BRUNA ZAMITH; CERRI, RICARDO; IEEE. A Genetic Algorithm for Transposable Elements Hierarchical Classification Rule Induction. 2018 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION (CEC), v. N/A, p. 8-pg., . (15/14300-1, 16/25078-0)
SANTOS, BRUNA Z.; NAKANO, FELIPE K.; CERRI, RICARDO; VENS, CELINE; HUTTER, F; KERSTING, K; LIJFFIJT, J; VALERA, I. Predictive Bi-clustering Trees for Hierarchical Multi-label Classification. MACHINE LEARNING AND KNOWLEDGE DISCOVERY IN DATABASES, ECML PKDD 2020, PT III, v. 12459, p. 18-pg., . (16/25078-0, 17/13218-5)