| Processo: | 22/07236-9 |
| Modalidade de apoio: | Bolsas no Exterior - Estágio de Pesquisa - Iniciação Científica |
| Data de Início da vigência: | 01 de setembro de 2022 |
| Data de Término da vigência: | 10 de dezembro de 2022 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação |
| Pesquisador responsável: | Tiago Agostinho de Almeida |
| Beneficiário: | Matheus Vargas Volpon Berto |
| Supervisor: | Carolina Evaristo Scarton |
| Instituição Sede: | Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil |
| Instituição Anfitriã: | University of Sheffield, Inglaterra |
| Vinculado à bolsa: | 21/13054-8 - Descoberta de conhecimento latente em artigos médicos sobre Leucemia Mieoloide Aguda, BP.IC |
| Assunto(s): | Redes neurais (computação) Aprendizado computacional Processamento de linguagem natural Inteligência artificial Análise de texto |
| Palavra(s)-Chave do Pesquisador: | Bidirectional Language Models | Language Models | machine learning | natural language processing | Inteligência Artificial |
Resumo O volume de informações produzidas e acessadas através da Internet é grande e crescente. Consequentemente, a quantidade de informações disponíveis em artigos científicos segue a mesma tendência, tornando inviável a análise manual de todo o conteúdo existente. Várias estratégias e arquiteturas de redes neurais artificiais surgiram para representar textos utilizando vetores densos, chamados de wordvectors. Estas técnicas estão em contínua evolução e são capazes de processar conjuntos cada vez mais significativos de textos com menos recursos computacionais. Elas permitem o treinamento de enormes modelos de representação de textos para domínios específicos do conhecimento, como é o caso do PubMedBERT. Utilizando um grande conjunto de textos de uma única área, o modelo pode capturar melhor as relações entre as palavras. Recentemente, ao criar modelos de representação a partir de prefácios de artigos científicos na ciência dos materiais, Tshitoyan et al. (2019) observaram que o conhecimento de certas relações entre elementos estava latente. Além disso, eles demonstraram que algumas relações encontradas nos textos foram descobertas apenas anos antes. Neste contexto, este projeto de pesquisa propõe extrair vetores de palavras de artigos científicos sobre uma doença específica para capturar e analisar se é possível obter conhecimentos latentes que possam acelerar a descoberta de novos diagnósticos, prognósticos e tratamentos. (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |