Busca avançada
Ano de início
Entree

Pré-processamento de textos de redes sociais para identificação de tópicos emergentes

Processo: 10/19546-5
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de março de 2011
Data de Término da vigência: 29 de fevereiro de 2012
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Maíra Machado Ladeira
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Mineração de dados   Mineração de texto   Pré-processamento de dados   Mídias sociais
Palavra(s)-Chave do Pesquisador:Mineração de Dados | redes sociais | Tópicos Emergentes | Inteligência Artificial - Mineração de dados

Resumo

As redes sociais, formadas por grupos de usuários com interesses comuns que se reúnem a fim de promover essa troca de idéias e conhecimentos, são um fenômeno emergente, gerando informação dinâmica que aborda tópicos referentes aos mais diversos domínios de acordo com os acontecimentos em tempo real. Tópicos sobre um dado domínio que apresentem um crescente interesse e utilidade em um dado espaço de tempo são conhecidos como tópicos emergentes. A extração de conhecimento a partir destes tópicos tem se mostrado de grande valia. Entretanto, a quantidade de dados gerados para um determinado assunto é, geralmente, muito grande, inviabilizando uma eficiente extração de conhecimento a partir da análise manual dos mesmos. Por meio de técnicas de mineração textual, automáticas ou semi-automáticas, é possível detectar tópicos emergentes e a freqüência na qual eles aparecem nas coleções de textos oriundas de redes sociais. Por ser constituída de textos curtos e informais, as técnicas clássicas de mineração de textos apresentam três principais problemas na fase de preparação e pré-processamento das coleções de texto das redes sociais: eliminação de palavras comuns, uso de gírias e abreviações, e neologismos e erros ortográficos. Essas ocorrências são muito comuns na escrita em ambientes de redes sociais, e normalmente seu tratamento não é contemplado nos processos tradicionais de mineração de textos. Somente com a superação desses problemas, durante a fase de pré-processamento dos dados, a base de dados textuais pode ser analisada para extração dos tópicos emergentes pretendida, o que torna a fase de pré-processamento parte importante, e foco, desse projeto. Propõe-se, então, a identificação e desenvolvimento de técnicas de mineração de textos para o pré-processamento de coleções de textos curtos oriundas de redes sociais com o objetivo de identificar tópicos emergentes.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)