| Processo: | 17/21174-8 |
| Modalidade de apoio: | Bolsas no Brasil - Pós-Doutorado |
| Data de Início da vigência: | 01 de janeiro de 2018 |
| Data de Término da vigência: | 02 de abril de 2024 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Fernando José von Zuben |
| Beneficiário: | Rosana Veroneze |
| Instituição Sede: | Faculdade de Engenharia Elétrica e de Computação (FEEC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil |
| Vinculado ao auxílio: | 13/07559-3 - Instituto Brasileiro de Neurociência e Neurotecnologia - BRAINN, AP.CEPID |
| Bolsa(s) vinculada(s): | 20/00123-9 - Uma abordagem integrada e interdisciplinar para a biclusterização e a programação por restrições, BE.EP.PD |
| Assunto(s): | Biologia computacional Neurociências Mineração de dados |
| Palavra(s)-Chave do Pesquisador: | bioinformática | Classificação baseada em associações | Enumeração Eficiente | Mineração de Biclusters | Mineração de padrões frequentes | Neurociência | Mineração de Dados |
Resumo A biclusterização provou ser uma técnica poderosa de análise de dados, com grande sucesso em vários domínios de aplicação. Recentemente, junto ao doutorado da candidata à bolsa, foi proposta uma família de algoritmos de biclusterização dotada de propriedades e funcionalidades únicas, as quais ainda não foram devidamente exploradas em áreas de aplicação de grande potencial de contribuição. A família conta com algoritmos capazes de enumerar todos os biclusters maximais com (i) valores constantes nas colunas, (ii) valores constantes nas linhas, e (iii) valores coerentes em matrizes de dados numéricas. Ademais, também estendemos um desses algoritmos para enumerar biclusters em matrizes de dados mistas (que podem conter atributos numéricos e/ou categóricos). Esse novo algoritmo é dotado de recursos adicionais e mais gerais, mas mantém as características de desempenho de seu predecessor. Para tornar o alcance de aplicações desses algoritmos ainda maior, os dois primeiros desafios desse projeto são torná-los ainda mais eficientes computacionalmente e implementá-los para execução em paralelo utilizando Unidades de Processamento Gráfico (GPUs). Dado que os algoritmos enumerativos podem retornar uma quantidade muito grande de biclusters, e que nem todos eles são relevantes para a análise dos dados, o segundo grande enfoque deste projeto é na seleção / ranqueamento dos biclusters. Desse modo, seremos capazes de fornecer ao usuário um conjunto compacto de biclusters que são ao mesmo tempo relevantes e pouco redundantes. Também exploraremos ainda mais a conexão entre biclusterização e mineração de padrões frequentes para o desenvolvimento de classificadores baseados em regras, mais especificamente, em associações extraídas a partir dos biclusters. Por fim, o último grande objetivo deste projeto é explorar o grande potencial de aplicações dessa família de algoritmos, com enfoque na análise de dados de expressão gênica e dados de atividade cerebral. Para o primeiro caso, contamos com uma parceria com o grupo de pesquisa da Profa. Dra. Raquel Scarel-Caminaga da FOAr-UNESP. Já o segundo caso está vinculado ao projeto CEPID intitulado BRAINN (Instituto Brasileiro de Neurociência e Neurotecnologia), já havendo um histórico recente de parceria com outros grupos vinculados ao BRAINN. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |