Busca avançada
Ano de início
Entree

Inteligência semiótica e Coronavírus: deep learning e análise do discurso em Português-Twitter

Processo: 20/15160-7
Modalidade de apoio:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de abril de 2021
Vigência (Término): 31 de março de 2026
Área do conhecimento:Linguística, Letras e Artes - Linguística
Pesquisador responsável:Waldir Beividas
Beneficiário:Tulio Ferreira Leite da Silva
Instituição Sede: Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Bolsa(s) vinculada(s):23/10101-0 - Hope speech: modelagem e validação de sistema de detecção automática de texto, BE.EP.DR
Assunto(s):Semiótica   Análise do discurso   Aprendizagem profunda   Processamento de linguagem natural   Língua portuguesa   Mídias sociais   Twitter   Pandemias   Coronavirus   Análise de sentimentos
Palavra(s)-Chave do Pesquisador:Análise de Sentimento | Coronavirus | Deep Learning | Processamento de Linguagem Natural | semiótica | Twitter | Semiótica

Resumo

A pandemia de Coronavirus transformou inúmeros termos científicos no foco de publicações de grande parte da população brasileira. Retiradas de seus contextos habituais, palavras como COVID, vírus, vacina e Coronavirus foram ressignificadas para expressar a intimidade dos usuários da rede social Twitter. Entre os dias 2 de maio e 16 de setembro, por meio de ferramentas de raspagem de dados (scrapers), coletamos 2,645 milhões de textos publicados naquela rede social. Entretanto, mais do que descobrir, quantitativamente e qualitativamente, como o brasileiro se relacionou com tais termos durante o período mencionado, nossa pesquisa pretende desenvolver um modelo semiótico para o processamento de linguagem natural e aprofundar metodologia desenvolvida durante o mestrado. Nele, utilizamos a semiótica greimasiana e desdobramentos contemporâneos conhecidos como prosodização do conteúdo, para desenvolver um método concorrente à análise de sentimento, para a plataforma TripAdvisor. O projeto, que se desdobra em uma especialização em Big Data na Escola Politécnica da USP, aguarda parecer favorável para ser patenteado. Apesar desse possível primeiro sucesso, os desafios com o Twitter são muito maiores. Afinal, enquanto plataformas de avaliação subsumem apenas a etapa de /Sanção/ (segundo o Esquema Narrativo Canônico), a rede de microblogues contempla todas as etapas (/Manipulação/, /Competencialização/, /Performance/, além daquela já mencionada). Para vencer tal desafio, acreditamos poder nos valer do conceito de narrativização da enunciação ou, mais precisamente, do tema da produção. Além disso, e dos conceitos já mencionados acima (e utilizados no mestrado), nos valemos da ideia por trás do termo português-twitter, cunhado em 2011 como estratégia para o desenvolvimento de um anotador morfosintático para a mesma plataforma, e da hipótese da "complexidade discursiva na internet", para tratar os textos produzidos no Twitter como uma "outra língua" (ou dialeto). Com sucesso, nossa pesquisa será precursora no oferecimento de metodologia para se processar linguagem natural nas redes sociais digitais - o que nos leva a considerar a obtenção de nova patente. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)