Busca avançada
Ano de início
Entree

Organização de dados governamentais públicos baseada em hierarquias de tópicos

Processo: 12/01617-9
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de maio de 2012
Data de Término da vigência: 30 de abril de 2013
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Daniel Luiz de Albuquerque
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial   Organização da informação   Mineração de texto   Dados categorizados   Coleta de dados
Palavra(s)-Chave do Pesquisador:dados governamentais abertos | Extração de padrões | Hierarquia de tópicos | Inteligência Artificial | Mineração de Texto | Modelo espaço-vetorial | Mineração de textos

Resumo

Com o intuito de promover uma maior transparência na política nos dias atuais, movimentos, em sua maioria americanos, aliados a novas propostas do governo Obama, firmaram tais ideias, que aos poucos estão se espalhando pelo mundo, inclusive no Brasil, que já possui movimentos de abertura de dados governamentais. Esta foi a inspiração para a confecção deste projeto. Dados governamentais abertos seguem uma série de regras em sua publicação, que permitem total manipulação e garantem facilidades na utilização. Em outros casos, os documentos são apenas públicos, com projetos futuros de abertura, de forma que sua publicação na rede é feita sem qualquer regra ou padrão, dificultando assim iniciativas que visam a utilização dos dados. Em geral, os dados governamentais estão em um formato bruto, o que dificulta tanto a visualização quanto o interesse da população pelas consultas a tal conteúdo. Associado a tal dificuldade, é constatado o crescimento progressivo da quantidade de informação, que torna a analise humana uma tarefa impraticável. De encontro com a percepção da necessidade de maior acessibilidade a estes dados, vem a mineração de textos, a partir da qual é possível realizar a organização e a extração de conhecimento do conteúdo. O projeto consiste em cinco fases, provenientes do processo de mineração de textos. Primeiramente deve ser feita a coleta e a transformação dos documentos em textos em formato bruto. Após a fase da coleta os dados se encontram inapropriados para a fase de extração de padrões, o que exige um bom tratamento, que privará, na medida do possível, o restante do processo quanto a inconsistências e resultados insatisfatórios. Na extração de padrões, os resultados se tornam mais evidentes, de forma que são criadas as hierarquias de tópicos, que definem as dependências entre termos e documentos. Tal organização dos dados também permite um aprimoramento no processo de busca, incentivando assim o uso da informação. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)