Advanced search
Start date
Betweenand

Portuguese Data Labeling for AI Models Focused on Natural Language Processing

Grant number: 25/20640-1
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: November 01, 2025
End date: June 30, 2027
Field of knowledge:Interdisciplinary Subjects
Principal Investigator:Felipe Iszlaji de Albuquerque
Grantee:Camila de Oliveira Muniz
CNAE: Desenvolvimento e licenciamento de programas de computador customizáveis
Atividades profissionais, científicas e técnicas não especificadas anteriormente
Associated research grant:24/20155-3 - CLARICE.AI: A WEB-BASED ARTIFICIAL INTELLIGENCE WRITING ASSISTANCE, AP.PIPE

Abstract

A Clarice.ai é uma startup de inteligência artificial focada no aprimoramento da escrita de textos de não ficção. Utilizando técnicas de processamento de linguagem natural (NLP) e inteligência artificial (IA), nossa plataforma oferece assistência em tempo real para revisão e edição de textos, enfatizando clareza, concisão, originalidade e força. O projeto, selecionado para as Fases 1 e 2 do Programa FAPESP Pesquisa Inovativa em Pequenas Empresas (PIPE), começou em agosto de 2019 e resultou no desenvolvimento de uma IA proprietária para tarefas de edição e melhoria de textos voltados para a web e marketing de conteúdo. Com mais de 350 mil usuários cadastrados e 80 mil usuários ativos mensalmente, nossa base inclui pequenas, médias e grandes empresas, assim como profissionais de marketing, jornalistas e acadêmicos. Recentemente, recebemos investimentos do Programa Inova Startups e de fundos de capital de risco, permitindo-nos avançar em pesquisa e desenvolvimento (P&D). A chegada do ChatGPT e de grandes modelos de linguagem (LLMs) em 2022 criou um novo panorama no mercado de ferramentas de auxílio à escrita, apresentando desafios técnico-científicos significativos. O objetivo deste projeto é desenvolver um LLM proprietário através de fine-tuning em um modelo open source, como o Llama 3.2. A combinação de conhecimento linguístico com técnicas de NLP visa aumentar a acurácia e o controle do usuário no processo de edição e revisão, além de humanizar textos gerados por LLMs genéricos. Outros desafios incluem: i) aumentar a acurácia da nossa IA proprietária na camada de estilo, especialmente para revisar textos gerados por LLMs como o ChatGPT; ii) expandir a escrita, edição e revisão para outros gêneros, como jornalismo e acadêmico; iii) ampliar nossa IA proprietária para outros idiomas, com foco inicial na língua espanhola e suas variantes na América Latina. Esperamos que os resultados desse projeto não apenas solidifiquem a posição da Clarice.ai no mercado, mas também proporcionem avanços significativos nas ferramentas de auxílio à escrita, beneficiando usuários em diversas áreas.

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)