Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim

Detalhes bibliográficos
Autor(a) principal: Missi XAVIER, Bruno
Data de Publicação: 2015
Outros Autores: Dias da SILVA, Alcione, Rodrigues GOMES, Geórgia Regina
Tipo de documento: Artigo
Idioma: por
Título da fonte: Transinformação (Online)
Texto Completo: https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056
Resumo: Text mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of Cachoeiro de Itapemirim in the state of Espírito Santo, transforming the information previously available in natural language into a structured format that can be persisted. To validate the architecture we developed a prototype in Java accessible in the Web environment to evaluate the tool. To evaluate the tool, a case study featured a database composed of 22  documents, containing 198 normative acts from the database of the Official Gazette, in which good levels of accuracy and coverage of information retrieval were identified. This study contributes to the presentation of a hybrid architecture consisting of components of the model of transactional systems and elements of text mining, in addition to the use of software design patterns.
id PUC_CAMP-4_c93596a035ecf0eef957313f0cd07d18
oai_identifier_str oai:ojs.periodicos.puc-campinas.edu.br:article/6056
network_acronym_str PUC_CAMP-4
network_name_str Transinformação (Online)
repository_id_str
spelling Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de ItapemirimText mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of Cachoeiro de Itapemirim in the state of Espírito Santo, transforming the information previously available in natural language into a structured format that can be persisted. To validate the architecture we developed a prototype in Java accessible in the Web environment to evaluate the tool. To evaluate the tool, a case study featured a database composed of 22  documents, containing 198 normative acts from the database of the Official Gazette, in which good levels of accuracy and coverage of information retrieval were identified. This study contributes to the presentation of a hybrid architecture consisting of components of the model of transactional systems and elements of text mining, in addition to the use of software design patterns.Técnicas de Mineração de Textos vêm sendo amplamente utilizadas para processamento de grandes volumes de documentos.Contudo, ainda há uma grande defasagem na tentativa de definir uma arquitetura para sistemas transacionais com elementos deinteligência computacional. Este trabalho tem o objetivo de apresentar uma proposta de arquitetura para a construção de umsistema computacional que utiliza técnicas de Mineração de Textos para indexar conteúdos da base do Diário Oficial do municípiode Itapemirim, no estado do Espírito Santo, transformando a informação antes disponível em linguagem natural para um formatoestruturado, passível de ser persistido. Para validar a arquitetura, foi desenvolvido um protótipo em linguagem Java acessível noambiente Web. Para avaliação da ferramenta, o estudo de caso proposto contou com uma base composta por 22 documentos,contendo 198 atos normativos da base daquele Diário Oficial, para os quais foram identificados bons níveis de precisão e abrangência na recuperação da informação. Este trabalho contribui com a apresentação de uma arquitetura híbrida, composta por elementos do modelo de sistemas transacionais e elementos da Mineração de Textos, além da utilização de padrões de projetos de software.Núcleo de Editoração - PUC-Campinas2015-03-25info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionPeer-reviewed ArticleArtículo revisado por paresAvaliado pelos Paresapplication/pdfhttps://periodicos.puc-campinas.edu.br/transinfo/article/view/6056Transinformação; Vol. 27 No. 1 (2015)Transinformação; Vol. 27 Núm. 1 (2015)Transinformação; v. 27 n. 1 (2015)2318-08890103-3786reponame:Transinformação (Online)instname:Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)instacron:PUC_CAMPporhttps://periodicos.puc-campinas.edu.br/transinfo/article/view/6056/3780Copyright (c) 2022 Transinformaçãohttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessMissi XAVIER, Bruno Dias da SILVA, Alcione Rodrigues GOMES, Geórgia Regina 2024-04-01T16:12:44Zoai:ojs.periodicos.puc-campinas.edu.br:article/6056Revistahttp://periodicos.puc-campinas.edu.br/seer/index.php/transinfo/indexPRIhttps://old.scielo.br/oai/scielo-oai.phpsbi.nucleodeeditoracao@puc-campinas.edu.br2318-08890103-3786opendoar:2024-04-01T16:12:44Transinformação (Online) - Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)false
dc.title.none.fl_str_mv Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
title Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
spellingShingle Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
Missi XAVIER, Bruno
title_short Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
title_full Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
title_fullStr Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
title_full_unstemmed Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
title_sort Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
author Missi XAVIER, Bruno
author_facet Missi XAVIER, Bruno
Dias da SILVA, Alcione
Rodrigues GOMES, Geórgia Regina
author_role author
author2 Dias da SILVA, Alcione
Rodrigues GOMES, Geórgia Regina
author2_role author
author
dc.contributor.author.fl_str_mv Missi XAVIER, Bruno
Dias da SILVA, Alcione
Rodrigues GOMES, Geórgia Regina
description Text mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of Cachoeiro de Itapemirim in the state of Espírito Santo, transforming the information previously available in natural language into a structured format that can be persisted. To validate the architecture we developed a prototype in Java accessible in the Web environment to evaluate the tool. To evaluate the tool, a case study featured a database composed of 22  documents, containing 198 normative acts from the database of the Official Gazette, in which good levels of accuracy and coverage of information retrieval were identified. This study contributes to the presentation of a hybrid architecture consisting of components of the model of transactional systems and elements of text mining, in addition to the use of software design patterns.
publishDate 2015
dc.date.none.fl_str_mv 2015-03-25
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Peer-reviewed Article
Artículo revisado por pares
Avaliado pelos Pares
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056
url https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056/3780
dc.rights.driver.fl_str_mv Copyright (c) 2022 Transinformação
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2022 Transinformação
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Núcleo de Editoração - PUC-Campinas
publisher.none.fl_str_mv Núcleo de Editoração - PUC-Campinas
dc.source.none.fl_str_mv Transinformação; Vol. 27 No. 1 (2015)
Transinformação; Vol. 27 Núm. 1 (2015)
Transinformação; v. 27 n. 1 (2015)
2318-0889
0103-3786
reponame:Transinformação (Online)
instname:Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)
instacron:PUC_CAMP
instname_str Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)
instacron_str PUC_CAMP
institution PUC_CAMP
reponame_str Transinformação (Online)
collection Transinformação (Online)
repository.name.fl_str_mv Transinformação (Online) - Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)
repository.mail.fl_str_mv sbi.nucleodeeditoracao@puc-campinas.edu.br
_version_ 1799125985037123584