Busca avançada
Ano de início
Entree

Classificação e análise de sequências bacterianas de RNA não-codificante com a utilização de técnicas de aprendizado de máquina

Processo: 21/08561-8
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2021
Data de Término da vigência: 30 de junho de 2022
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Breno Livio Silva de Almeida
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Biologia computacional   Ciência de dados   Aprendizado computacional   Genoma humano   Extração   Metodologia e técnicas de computação
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | bioinformática | Ciência de dados | Aprendizado de Máquina

Resumo

Ao ser descoberto que pelo menos 80% do genoma humano é biologicamente ativo, o conteúdo do genoma humano que não codifica proteína passou a não ser visto mais apenas como DNA "lixo". Sequências não-codificantes acabaram por conseguir um espaço cada vez maior em pesquisas recentes por papéis importantes envolvendo processos fisiológicos em organismos. Os pequenos RNAs não-codificantes então ganham uma maior relevância para fundamentalmente entender esses processos. Para a identificação de sequências biológicas como os pequenos RNAs é possível extrair características por meio de descritores matemáticos, que podem auxiliar em apontar especificidades em diferentes tipos de sequências. Essa tarefa pode ser aliada às técnicas de Aprendizado de Máquina, que podem aprender automaticamente com os padrões dos descritores matemáticos das sequências, realizando classificações, além de apontar quais descritores são realmente importantes para a classificação. Dessa forma, o projeto almeja em utilizar dessas técnicas e extração de características para classificar e analisar sequências bacterianas de pequenos RNAs não-codificantes, tendo a intenção de estudar o uso efetivo desses descritores e diferenciar essas sequências dentre outras. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SILVA DE ALMEIDA, BRENO LIVIO; QUEIROZ, ALVARO PEDROSO; AVILA SANTOS, ANDERSON PAULO; BONIDIA, ROBSON PARMEZAN; DA ROCHA, ULISSES NUNES; SANCHES, DANILO SIPOLI; DE LEON FERREIRA DE CARVALHO, ANDRE CARLOS PONCE; STADLER, PF; WALTER, MEMT; HERNANDEZ-ROSALES, M; et al. Feature Importance Analysis of Non-coding DNA/RNA Sequences Based on Machine Learning Approaches. ADVANCES IN BIOINFORMATICS AND COMPUTATIONAL BIOLOGY, BSB 2021, v. 13063, p. 12-pg., . (21/08561-8)
BONIDIA, ROBSON P.; AVILA SANTOS, ANDERSON P.; DE ALMEIDA, BRENO L. S.; STADLER, PETER F.; DA ROCHA, ULISSES NUNES; SANCHES, DANILO S.; DE CARVALHO, ANDRE C. P. L. F.. Information Theory for Biological Sequence Classification: A Novel Feature Extraction Technique Based on Tsallis Entropy. Entropy, v. 24, n. 10, p. 17-pg., . (13/07375-0, 21/08561-8)
BONIDIA, ROBSON P.; AVILA SANTOS, ANDERSON P.; DE ALMEIDA, BRENO L. S.; STADLER, PETER F.; DA ROCHA, ULISSES N.; SANCHES, DANILO S.; DE CARVALHO, ANDRE C. P. L. F.. BioAutoML: automated feature engineering and metalearning to predict noncoding RNAs in bacteria. BRIEFINGS IN BIOINFORMATICS, v. N/A, p. 13-pg., . (13/07375-0, 21/08561-8)