Busca avançada
Ano de início
Entree

Seleção de genes e validação de agrupamento em dados de expressão gênica

Processo: 11/04247-5
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de junho de 2011
Vigência (Término): 30 de novembro de 2015
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo José Gabrielli Barreto Campello
Beneficiário:Pablo Andretta Jaskowiak
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:06/50231-5 - Inteligência computacional em mineração de dados e suas aplicações, AP.JP
Bolsa(s) vinculada(s):12/15751-9 - Seleção de genes e outliers em dados de microarray, BE.EP.DR
Assunto(s):Aprendizado computacional   Biologia computacional   Mineração de dados

Resumo

O desenvolvimento da tecnologia de microarray possibilitou a geração e coleta de grandes quantidades de dados sobre os mais diversos fenômenos biológicos, motivando a criação de métodos tanto do aprendizado supervisionado quanto não-supervisionado para sua análise. Embora a tecnologia permita a medição dos níveis de expressão de milhares de genes simultaneamente, a análise dos dados gerados apresenta-se como um grande desafio. Neste projeto são apresentadas duas frentes de pesquisa, pertinentes à análise de dados de expressão gênica: a seleção de genes e a validação de agrupamento. A seleção de genes possui por objetivo a identificação de genes informativos que permitam a construção de classificadores eficientes para distinguir, por exemplo, entre diferentes tipos de câncer. O agrupamento de dados, por sua vez, é responsável, por exemplo, pela determinação de funções de genes para os quais poucas informações encontram-se disponíveis ou pela descoberta de novos subtipos de doenças. Por se tratar de uma tarefa não supervisionada, sua validação é essencial para a interpretação e confiabilidade dos resultados obtidos. Os objetivos deste projeto estão relacionados às duas frentes de pesquisa supracitadas. No contexto de seleção de genes são contemplados o estudo e o desenvolvimento de abordagens híbridas e/ou que incorporem conhecimento biológico durante o processo de seleção. Quanto à validação de agrupamento de genes, é apresentada neste projeto uma proposta para o estudo e desenvolvimento de critérios de validação que façam uso do conhecimento biológico previamente disponível. Ainda nesta frente de pesquisa, pretende-se investigar e desenvolver critérios de validação que combinem critérios tradicionais e biológicos de validação. Por fim, propõem-se a avaliação extensiva de critérios de validação no cenário específico de agrupamento de amostras.

Publicações científicas (5)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
JASKOWIAK, PABLO ANDRETTA; COSTA, IVAN G.; CAMPELLO, RICARDO J. G. B. Clustering of RNA-Seq samples: Comparison study on cancer data. METHODS, v. 132, p. 42-49, JAN 1 2018. Citações Web of Science: 2.
JASKOWIAK, PABLO A.; MOULAVI, DAVOUD; FURTADO, ANTONIO C. S.; CAMPELLO, RICARDO J. G. B.; ZIMEK, ARTHUR; SANDER, JOERG. On strategies for building effective ensembles of relative clustering validity criteria. KNOWLEDGE AND INFORMATION SYSTEMS, v. 47, n. 2, p. 329-354, MAY 2016. Citações Web of Science: 9.
DE SOUTO, MARCILIO C. P.; JASKOWIAK, PABLO A.; COSTA, IVAN G. Impact of missing data imputation methods on gene expression clustering and classification. BMC Bioinformatics, v. 16, FEB 26 2015. Citações Web of Science: 20.
JASKOWIAK, PABLO A.; CAMPELLO, RICARDO J. G. B.; COSTA, IVAN G. On the selection of appropriate distances for gene expression data clustering. BMC Bioinformatics, v. 15, n. 2 JAN 24 2014. Citações Web of Science: 37.
JASKOWIAK, PABLO A.; CAMPELLO, RICARDO J. G. B.; COSTA, IVAN G. Proximity Measures for Clustering Gene Expression Microarray Data: A Validation Methodology and a Comparative Analysis. IEEE-ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS, v. 10, n. 4, p. 845-857, JUL-AUG 2013. Citações Web of Science: 18.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
JASKOWIAK, Pablo Andretta. Sobre a avaliação de resultados de agrupamento: medidas, comitês e análise de dados de expressão gênica. 2015. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.