Busca avançada
Ano de início
Entree

Algoritmos enumerativos para biclusterização: expandindo e explorando seu potencial em bioinformática e em neurociência

Processo: 17/21174-8
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Data de Início da vigência: 01 de janeiro de 2018
Data de Término da vigência: 02 de abril de 2024
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Fernando José von Zuben
Beneficiário:Rosana Veroneze
Instituição Sede: Faculdade de Engenharia Elétrica e de Computação (FEEC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Vinculado ao auxílio:13/07559-3 - Instituto Brasileiro de Neurociência e Neurotecnologia - BRAINN, AP.CEPID
Bolsa(s) vinculada(s):20/00123-9 - Uma abordagem integrada e interdisciplinar para a biclusterização e a programação por restrições, BE.EP.PD
Assunto(s):Biologia computacional   Neurociências   Mineração de dados
Palavra(s)-Chave do Pesquisador:bioinformática | Classificação baseada em associações | Enumeração Eficiente | Mineração de Biclusters | Mineração de padrões frequentes | Neurociência | Mineração de Dados

Resumo

A biclusterização provou ser uma técnica poderosa de análise de dados, com grande sucesso em vários domínios de aplicação. Recentemente, junto ao doutorado da candidata à bolsa, foi proposta uma família de algoritmos de biclusterização dotada de propriedades e funcionalidades únicas, as quais ainda não foram devidamente exploradas em áreas de aplicação de grande potencial de contribuição. A família conta com algoritmos capazes de enumerar todos os biclusters maximais com (i) valores constantes nas colunas, (ii) valores constantes nas linhas, e (iii) valores coerentes em matrizes de dados numéricas. Ademais, também estendemos um desses algoritmos para enumerar biclusters em matrizes de dados mistas (que podem conter atributos numéricos e/ou categóricos). Esse novo algoritmo é dotado de recursos adicionais e mais gerais, mas mantém as características de desempenho de seu predecessor. Para tornar o alcance de aplicações desses algoritmos ainda maior, os dois primeiros desafios desse projeto são torná-los ainda mais eficientes computacionalmente e implementá-los para execução em paralelo utilizando Unidades de Processamento Gráfico (GPUs). Dado que os algoritmos enumerativos podem retornar uma quantidade muito grande de biclusters, e que nem todos eles são relevantes para a análise dos dados, o segundo grande enfoque deste projeto é na seleção / ranqueamento dos biclusters. Desse modo, seremos capazes de fornecer ao usuário um conjunto compacto de biclusters que são ao mesmo tempo relevantes e pouco redundantes. Também exploraremos ainda mais a conexão entre biclusterização e mineração de padrões frequentes para o desenvolvimento de classificadores baseados em regras, mais especificamente, em associações extraídas a partir dos biclusters. Por fim, o último grande objetivo deste projeto é explorar o grande potencial de aplicações dessa família de algoritmos, com enfoque na análise de dados de expressão gênica e dados de atividade cerebral. Para o primeiro caso, contamos com uma parceria com o grupo de pesquisa da Profa. Dra. Raquel Scarel-Caminaga da FOAr-UNESP. Já o segundo caso está vinculado ao projeto CEPID intitulado BRAINN (Instituto Brasileiro de Neurociência e Neurotecnologia), já havendo um histórico recente de parceria com outros grupos vinculados ao BRAINN.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DAM, KHANH HUU THE; -WILSON, THOMAS GIVEN; LEGAY, AXEL; VERONEZE, ROSANA. Packer classification based on association rule mining. APPLIED SOFT COMPUTING, v. 127, p. 21-pg., . (20/00123-9, 17/21174-8)
VERONEZE, ROSANA; CRUZ TFAILE CORBI, SAMIA; ROQUE DA SILVA, BARBARA; DE S. ROCHA, CRISTIANE; V. MAURER-MORELLI, CLAUDIA; PEREZ ORRICO, SILVANA REGINA; CIRELLI, JONI A.; VON ZUBEN, FERNANDO J.; MANTUANELI SCAREL-CAMINAGA, RAQUEL. Using association rule mining to jointly detect clinical features and differentially expressed genes related to chronic inflammatory diseases. PLoS One, v. 15, n. 10, p. 22-pg., . (16/25418-6, 09/16233-9, 10/10882-2, 17/21174-8, 14/16148-0, 07/08362-8)