| Processo: | 21/13054-8 |
| Modalidade de apoio: | Bolsas no Brasil - Iniciação Científica |
| Data de Início da vigência: | 01 de janeiro de 2022 |
| Data de Término da vigência: | 10 de abril de 2023 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação |
| Pesquisador responsável: | Tiago Agostinho de Almeida |
| Beneficiário: | Matheus Vargas Volpon Berto |
| Instituição Sede: | Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil |
| Bolsa(s) vinculada(s): | 22/07236-9 - Arquiteturas transformers profundas e bidirecionais para descoberta de conhecimento latente em artigos médicos sobre Leucemia Mieloide Aguda, BE.EP.IC |
| Assunto(s): | Inteligência artificial Leucemia mieloide aguda Aprendizado computacional Técnicas computacionais |
| Palavra(s)-Chave do Pesquisador: | Aprendizado de Máquina | Descoberta de padrões | Modelos de linguagem | Processamento De Língua Natural | Inteligência Artificial |
Resumo O volume de informações produzidas e acessadas por meio da Internet é grande e crescente. A quantidade de informação disponibilizada em artigos científicos segue a mesma tendência, inviabilizando a análise manual de todo o conteúdo existente. No últimos anos, surgiram diversas estratégias e arquiteturas de redes neurais artificiais com o intuito de representar textos usando vetores densos, chamados word vectors. Essas técnicas vêm evoluindo continuamente e são capazes de processar conjuntos de textos cada vez maiores com menos recursos computacionais. Com isso, modelos de representação de textos passaram a ser criados para áreas de conhecimento específicas, como é o caso do PubMedBERT, que por utilizar um corpus de um único domínio, permite que o modelo capture melhor as relações entre as palavras. Recentemente, ao criar modelos de representações a partir de prefácios de artigos científicos da área de ciência dos materiais, Tshitoyan et al., (2019) observaram que o conhecimento de certas relações entre elementos estavam latentes. Eles demonstraram que as relações existiam nos textos anos antes de terem sido descobertas. Nesse contexto, este projeto de pesquisa propõe treinar word vectors a partir de artigos científicos de uma área médica específica, com o intuito de capturar e analisar se é possível obter conhecimento latente que possa acelerar a descoberta de novos diagnósticos, prognósticos e tratamentos. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |