Busca avançada
Ano de início
Entree

Seleção de Genes e Validação de Agrupamento em Dados de Expressão Gênica

Processo: 11/04247-5
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de junho de 2011
Data de Término da vigência: 30 de novembro de 2015
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo José Gabrielli Barreto Campello
Beneficiário:Pablo Andretta Jaskowiak
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:06/50231-5 - Inteligência computacional em mineração de dados e suas aplicações, AP.JP
Bolsa(s) vinculada(s):12/15751-9 - Seleção de genes e outliers em dados de microarray, BE.EP.DR
Assunto(s):Aprendizado computacional   Biologia computacional   Mineração de dados
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | bioinformática | Seleção de Genes | Validação de Agrupamento | Mineração de Dados

Resumo

O desenvolvimento da tecnologia de microarray possibilitou a geração e coleta de grandes quantidades de dados sobre os mais diversos fenômenos biológicos, motivando a criação de métodos tanto do aprendizado supervisionado quanto não-supervisionado para sua análise. Embora a tecnologia permita a medição dos níveis de expressão de milhares de genes simultaneamente, a análise dos dados gerados apresenta-se como um grande desafio. Neste projeto são apresentadas duas frentes de pesquisa, pertinentes à análise de dados de expressão gênica: a seleção de genes e a validação de agrupamento. A seleção de genes possui por objetivo a identificação de genes informativos que permitam a construção de classificadores eficientes para distinguir, por exemplo, entre diferentes tipos de câncer. O agrupamento de dados, por sua vez, é responsável, por exemplo, pela determinação de funções de genes para os quais poucas informações encontram-se disponíveis ou pela descoberta de novos subtipos de doenças. Por se tratar de uma tarefa não supervisionada, sua validação é essencial para a interpretação e confiabilidade dos resultados obtidos. Os objetivos deste projeto estão relacionados às duas frentes de pesquisa supracitadas. No contexto de seleção de genes são contemplados o estudo e o desenvolvimento de abordagens híbridas e/ou que incorporem conhecimento biológico durante o processo de seleção. Quanto à validação de agrupamento de genes, é apresentada neste projeto uma proposta para o estudo e desenvolvimento de critérios de validação que façam uso do conhecimento biológico previamente disponível. Ainda nesta frente de pesquisa, pretende-se investigar e desenvolver critérios de validação que combinem critérios tradicionais e biológicos de validação. Por fim, propõem-se a avaliação extensiva de critérios de validação no cenário específico de agrupamento de amostras.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (7)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
JASKOWIAK, PABLO A.; CAMPELLO, RICARDO J. G. B.; COSTA, IVAN G.. On the selection of appropriate distances for gene expression data clustering. BMC Bioinformatics, v. 15, p. 17-pg., . (11/04247-5, 12/15751-9)
JASKOWIAK, PABLO A.; CAMPELLO, RICARDO J. G. B.; COSTA, IVAN G.. On the selection of appropriate distances for gene expression data clustering. BMC Bioinformatics, v. 15, n. 2, . (12/15751-9, 11/04247-5)
JASKOWIAK, PABLO ANDRETTA; COSTA, IVAN G.; CAMPELLO, RICARDO J. G. B.. Clustering of RNA-Seq samples: Comparison study on cancer data. METHODS, v. 132, p. 42-49, . (11/04247-5)
DE SOUTO, MARCILIO C. P.; JASKOWIAK, PABLO A.; COSTA, IVAN G.. Impact of missing data imputation methods on gene expression clustering and classification. BMC Bioinformatics, v. 16, . (11/04247-5)
JASKOWIAK, PABLO A.; MOULAVI, DAVOUD; FURTADO, ANTONIO C. S.; CAMPELLO, RICARDO J. G. B.; ZIMEK, ARTHUR; SANDER, JOERG. On strategies for building effective ensembles of relative clustering validity criteria. KNOWLEDGE AND INFORMATION SYSTEMS, v. 47, n. 2, p. 329-354, . (12/15751-9, 10/20032-6, 11/04247-5)
JASKOWIAK, PABLO A.; CAMPELLO, RICARDO J. G. B.; COSTA, IVAN G.. Proximity Measures for Clustering Gene Expression Microarray Data: A Validation Methodology and a Comparative Analysis. IEEE-ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS, v. 10, n. 4, p. 845-857, . (11/04247-5)
JASKOWIAK, PABLO A.; COSTA, IVAN G.; CAMPELLO, RICARDO J. G. B.. The area under the ROC curve as a measure of clustering quality. DATA MINING AND KNOWLEDGE DISCOVERY, v. 36, n. 3, p. 27-pg., . (11/04247-5)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
JASKOWIAK, Pablo Andretta. Sobre a avaliação de resultados de agrupamento: medidas, comitês e análise de dados de expressão gênica. 2015. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.