Busca avançada
Ano de início
Entree

Clarice.ai: uma inteligência linguística de auxílio à escrita de não ficção baseada na web

Processo: 18/22511-0
Linha de fomento:Auxílio à Pesquisa - Pesquisa Inovativa em Pequenas Empresas - PIPE
Vigência: 01 de agosto de 2019 - 30 de abril de 2020
Área do conhecimento:Linguística, Letras e Artes - Linguística - Linguística Aplicada
Pesquisador responsável:Felipe Iszlaji de Albuquerque
Beneficiário:Felipe Iszlaji de Albuquerque
Empresa:Clarice Inteligência Artificial Ltda
CNAE: Portais, provedores de conteúdo e outros serviços de informação na internet
Outras atividades de prestação de serviços de informação não especificadas anteriormente
Município: São Paulo
Bolsa(s) vinculada(s):19/18923-4 - Clarice.ai: uma inteligência linguística de auxílio à escrita de não ficção baseada na web, BP.TT

Resumo

O projeto de pesquisa aqui apresentado propõe a construção de uma inteligência linguística capaz de assistir em tempo real o usuário que esteja escrevendo um texto de não ficção. Ela pode ser comparada com os assistentes de correção ortográficos e gramaticais já existentes em editores de texto como o Microsoft Word e outros. No entanto, o diferencial do projeto é construir uma inteligência linguística não nos níveis ortográficos e gramaticais, mas sim no nível do estilo empregado em diferentes gêneros de não ficção. A tecnologia deverá auxiliar o usuário em técnicas de escrita dentro de categorias que estamos chamando de i) Redigibilidade do texto, ii) Aspectos visuais do texto, iii) Estilística fônica, iv) Estilística sintática e v) Estilística léxico-semântica. Alguns exemplos comuns de desvios nesse nível de escrita são: uso excessivo de adjetivos e advérbios; uso excessivo da voz passiva; sentenças muito longas; uso de clichês e frases feitas; repetição de palavras; uso excessivo de conjunções como 'que' e 'e'; cacofonias, eco e aliterações.Já existem ferramentas semelhantes produzidas para outras línguas, em especial para o inglês. O surgimento desta ferramenta pode ser explicada por dois fatores. Primeiro, porque o avanço das técnicas de processamento automático de linguagem natural permitiram o desenvolvimento da tecnologia. Segundo, porque verificou-se a aplicação comercial em dois mercados emergentes, o mercado das EdTechs (tecnologias para a Educação) e o mercado de Marketing de Conteúdo (produção de conteúdo para o ranqueamento de marcas e produtos em mecanismos de busca). O mercado de Marketing de Conteúdo no Brasil é grande e continua crescendo. Apenas uma empresa, como a RockContent, produz quase 10 mil artigos por mês. Esse volume de produção de textos demanda um crescente número de redatores. Estima-se que hoje existam 100 mil redatores freelancers no Brasil. E para cada 20 redatores é necessário um revisor. Essa demanda é superior à capacidade de formar bons redatores e revisores. Por isso, a ferramenta aqui proposta tem o potencial de contribuir para esse mercado de forma a melhorar a qualidade dos textos produzidos ao mesmo tempo em que reduz custos para os produtores de conteúdo.O resultado almejado é, portanto, um editor de texto baseado na nuvem, com acesso web em diferentes dispositivos, que aciona uma inteligência artificial linguística para fornecer feedbacks, em tempo real, com dicas de "como escrever bem". Com relação à metodologia da pesquisa, delimitamos o escopo do projeto no subcampo de pesquisas em Processamento da Linguagem Natural (doravante PLN) e no âmbito de investigações que projetam e desenvolvem ferramentas de auxílio à escrita. Uma das principais estratégias do projeto de pesquisa aqui apresentado é utilizar os recursos linguísticos já desenvolvidos por laboratórios de pesquisa, para avançar na construção de um produto inovador, de uso massivo e valor comercial.O resumo da metodologia pode ser explicitado como i) identificar um Desvio de linguagem ou estilístico de forma automática, ii) por meio dos Recursos linguísticos computacionais disponíveis ou construídos, iii) e fornecer a Dica que deverá ser exibida como feedback em tempo real para o usuário. Começaremos com a identificação dos 80 desvios mais comuns para o gênero "artigo de 500-1000 palavras para Marketing de Conteúdo na internet" e lançaremos a versão beta com essa proposta de valor. (AU)

Mapa da distribuição dos acessos desta página
Para ver o sumário de acessos desta página, clique aqui.