Busca avançada
Ano de início
Entree

E-SHARE miner: gerenciamento de informação apoiado pela descoberta de conhecimento via taxonomia de tópicos

Processo: 18/10658-7
Linha de fomento:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Vigência (Início): 01 de agosto de 2018
Vigência (Término): 28 de fevereiro de 2019
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Marco Antonio Pereira
Beneficiário:Eduardo Fernando Velludo Prado
Empresa:Itera Inovação e Desenvolvimento Tecnológico Ltda. - ME
Vinculado ao auxílio:16/50231-7 - e-SHARE miner: gerenciamento de informação apoiado pela descoberta de conhecimento via taxonomia de tópicos, AP.PIPE
Assunto(s):Gestão da informação   Gestão do conhecimento   Gestão de documentos   Recuperação da informação   Mineração de texto   Mineração de dados

Resumo

A quantidade de dados disponível em formato digital na rede mundial de computadores tem aumentado incessantemente. De acordo com estimativas realizadas em 2014, de 2013 a 2020 o universo digital irá aumentar de 4,4 trilhões de gigabytes para 44 trilhões de gigabytes (Turner et al., 2014). Parte dos dados no universo digital está no formato textual. De acordo com (Ur-Rahman e Harding, 2012) e (Kuechler, 2007), aproximadamente 80% das informações corporativas são compostas por dados textuais, como e-mails, relatórios, boletins, artigos, registros de pacientes e conteúdo de páginas web. Além disso, com o advento da Web 2.0, dados textuais tem sido utilizados como meio para disseminar informações, seja por postagens em redes sociais, wikis ou blogs (Fuchs et al., 2013), (O'Reilly, 2009), (Shelly e Frydenberg, 2009). Neste sentido, o principal produto do portfólio da Itera é o e-SHARE , um software de Gerenciamento Eletrônico de Documentos (GED), que possibilita o gerenciamento e armazenamento de documentos em formato digital, indexando o conteúdo desses documentos e possibilitando a recuperação mais precisa desses documentos. Apesar do e-SHARE ter sido desenvolvido para atender os mais variados segmentos de mercado, considerando sua análise de mercado, a Itera optou pela estratégia de focar em um mercado verticalizado, o mercado das empresas que atuam na área de prestação de serviços advocatícios, os quais já são, atualmente, os principais clientes da Itera. Assim, atendendo os advogados que atuam em escritórios clientes, a Itera identificou uma necessidade atrelada ao dia a dia desses profissionais. A necessidade dessa área é a de se reutilizar documentos já existentes para que sirvam de documento-base (modelos). Atualmente, essa reutilização é precedida pela identificação de uma subcoleção de documentos. Esses documentos têm partes de seus conteúdos copiados, as quais são utilizadas para a criação de um novo documento, para que, somente a partir daí, esse novo documento tenha o seu conteúdo modificado de acordo com as necessidades do advogado. Na prática, a identificação dessa subcoleção de documentos é um processo que, em geral, demanda muito esforço e tempo, pois, os advogados têm que utilizar de suas experiências e intuições para explorar o montante de documentos, para, a partir daí, começar a explorar os conteúdos dos documentos identificados na busca pelo preenchimento dos requisitos demandados para a construção de um novo documento. A saber, o e-SHARE possui mecanismos que facilitam a identificação dos documentos gerenciados pelos advogados, que se utilizam dos filtros disponíveis para fazer a busca pelo conteúdo dos documentos e em seus metadados. Porém, acreditamos que técnicas de Mineração de Textos possam ser utilizadas a fim descobrir conhecimento que possa ser usado para possibilitar a redução do tempo e do esforço desprendido no processo de exploração e identificação de documentos, para que em seguida, possam servir de documento-base para a construção de novos documentos. Assim, o objetivo deste projeto é promover inovação com a gestão de conhecimento aliada à gestão de documentos no e-SHARE, oferecendo um ambiente de gerenciamento de informação apoiado pela disponibilização de conhecimento embutido nos documentos via extração de tópicos. Este ambiente, como produto, permitirá novas formas de exploração e apresentação dos documentos, possibilitando um melhor entendimento e facilidade na exploração e recuperação de documentos de interesse. (AU)