Busca avançada
Ano de início
Entree

Indução, a partir de textos, de redes bayesianas baseadas em tópicos para previsão de rendimentos de cana de açúcar.

Processo: 11/20451-1
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Data de Início da vigência: 01 de agosto de 2013
Data de Término da vigência: 31 de julho de 2016
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Alneu de Andrade Lopes
Beneficiário:Brett Mylo Drury
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial
Palavra(s)-Chave do Pesquisador:Bayesian Networks | Sugar Cane Yields | Inteligência Artificial

Resumo

Documentos textuais podem conter informações oportunas que em geral auxiliam nas decisões de negócios. Fontes textuais podem representar informações difíceis de serem representadas em outros formatos. Essas informações podem ser difíceis de interpretar, pois: 1. linguagem natural pode ser ambígua ou contraditória, 2. linguagem natural pode conter eufemismos e linguagem inventada e 3. conceitos simples podem ser representados por muitas palavras ou termos. A área de Processamento de Linguagem Natural fornece uma série de metodologias para resolver estes problemas. Detecção de tópicos e classificação de sentimentos são as metodologias mais relevantes para extrair informações de fontes textuais, mas elas têm suas falhas. Detecção de Tópicos pode identificar temas latentes em uma coleção de documentos, porém essa metodologia não contém nenhum mecanismo para aplicar as informações obtidas em um problema específico. Classificação de Sentimento, em especial análise de sentimento baseado em atributos, permite o direcionamento das emoções no texto a uma característica específica de um produto ou a uma entidade de destino. Análise de sentimentos baseada em atributos não determina a importância ou classificação do atributo. Por exemplo, não é possível determinar se a performance de um carro é mais ou menos importante do que seu consumo de combustível. Assim, este projeto tem como objetivo avançar o estado da arte em extração e classificação de informação em texto para fazer inferências sobre um problema externo. O problema externo é a previsão do rendimento futuro das colheitas de culturas. Notícias agrícolas contêm informações a partir das quais previsões dos rendimentos da colheita podem ser feitas, por exemplo, relatórios meteorológicos ou números sobre infestações de pragas. Informação textual contém tópicos que são grupos de palavras estatisticamente relacionados. Atualmente não existem técnicas para estabelecer uma relação direta entre a informação que está contida nestes tópicos com o rendimento das culturas. O projeto procurará modelar essas relações por meio da construção de um modelo estruturado dos domínios específicos dos tópicos contidos em notícias agrícolas. Os temas conterão características e eventos/sentimentos que podem ser atribuídos a essas características e, portanto, os tópicos poderão ser rotulados como negativos ou positivos. O modelo estruturado permitirá a previsão de relações entre os tópicos. Por exemplo, uma determinada sequência de condições meteorológicas pode aumentar a população de pragas. O modelo estruturado e suas relações inferida poderão ser usados para fazer inferências específicas para abordagem de rendimento de culturas. O projeto proposto aborda alguns pontos fracos na aplicação de métodos estruturados para prever o rendimento das culturas. Na revisão da literatura realizada para este projeto observou-se que as redes Bayesianas para previsão de culturas são geralmente construídas a partir de fatores já conhecidos, como por exemplo: condições meteorológicas ou regimes de pulverização de pesticidas. O projeto proposto visa a aprender essas redes Bayesianas diretamente dos textos das notícias através da identificação de temas e suas inter-relações. Esta abordagem não supervisionada/semissupervisionada permitirá a identificação de fatores latentes que podem melhorar a capacidade preditiva de uma Rede Bayesiana.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DRURY, BRETT; VALVERDE-REBAZA, JORGE; MOURA, MARIA-FERNANDA; LOPES, ALNEU DE ANDRADE. A survey of the applications of Bayesian networks in agriculture. ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE, v. 65, p. 29-42, . (13/12191-5, 11/20451-1, 15/14228-9)
VALEJO, ALAN; VALVERDE-REBAZA, JORGE; DRURY, BRETT; LOPES, ALNEU DE ANDRADE; ALMEIDA, A; BERNARDINO, J; GOMES, EF. Multilevel refinement based on neighborhood similarity. PROCEEDINGS OF THE 18TH INTERNATIONAL DATABASE ENGINEERING AND APPLICATIONS SYMPOSIUM (IDEAS14), v. N/A, p. 10-pg., . (11/20451-1, 11/22749-8, 13/12191-5)