Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Transinformação (Online) |
Texto Completo: | https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056 |
Resumo: | Text mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of Cachoeiro de Itapemirim in the state of Espírito Santo, transforming the information previously available in natural language into a structured format that can be persisted. To validate the architecture we developed a prototype in Java accessible in the Web environment to evaluate the tool. To evaluate the tool, a case study featured a database composed of 22 documents, containing 198 normative acts from the database of the Official Gazette, in which good levels of accuracy and coverage of information retrieval were identified. This study contributes to the presentation of a hybrid architecture consisting of components of the model of transactional systems and elements of text mining, in addition to the use of software design patterns. |
id |
PUC_CAMP-4_c93596a035ecf0eef957313f0cd07d18 |
---|---|
oai_identifier_str |
oai:ojs.periodicos.puc-campinas.edu.br:article/6056 |
network_acronym_str |
PUC_CAMP-4 |
network_name_str |
Transinformação (Online) |
repository_id_str |
|
spelling |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de ItapemirimText mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of Cachoeiro de Itapemirim in the state of Espírito Santo, transforming the information previously available in natural language into a structured format that can be persisted. To validate the architecture we developed a prototype in Java accessible in the Web environment to evaluate the tool. To evaluate the tool, a case study featured a database composed of 22 documents, containing 198 normative acts from the database of the Official Gazette, in which good levels of accuracy and coverage of information retrieval were identified. This study contributes to the presentation of a hybrid architecture consisting of components of the model of transactional systems and elements of text mining, in addition to the use of software design patterns.Técnicas de Mineração de Textos vêm sendo amplamente utilizadas para processamento de grandes volumes de documentos.Contudo, ainda há uma grande defasagem na tentativa de definir uma arquitetura para sistemas transacionais com elementos deinteligência computacional. Este trabalho tem o objetivo de apresentar uma proposta de arquitetura para a construção de umsistema computacional que utiliza técnicas de Mineração de Textos para indexar conteúdos da base do Diário Oficial do municípiode Itapemirim, no estado do Espírito Santo, transformando a informação antes disponível em linguagem natural para um formatoestruturado, passível de ser persistido. Para validar a arquitetura, foi desenvolvido um protótipo em linguagem Java acessível noambiente Web. Para avaliação da ferramenta, o estudo de caso proposto contou com uma base composta por 22 documentos,contendo 198 atos normativos da base daquele Diário Oficial, para os quais foram identificados bons níveis de precisão e abrangência na recuperação da informação. Este trabalho contribui com a apresentação de uma arquitetura híbrida, composta por elementos do modelo de sistemas transacionais e elementos da Mineração de Textos, além da utilização de padrões de projetos de software.Núcleo de Editoração - PUC-Campinas2015-03-25info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionPeer-reviewed ArticleArtículo revisado por paresAvaliado pelos Paresapplication/pdfhttps://periodicos.puc-campinas.edu.br/transinfo/article/view/6056Transinformação; Vol. 27 No. 1 (2015)Transinformação; Vol. 27 Núm. 1 (2015)Transinformação; v. 27 n. 1 (2015)2318-08890103-3786reponame:Transinformação (Online)instname:Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)instacron:PUC_CAMPporhttps://periodicos.puc-campinas.edu.br/transinfo/article/view/6056/3780Copyright (c) 2022 Transinformaçãohttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessMissi XAVIER, Bruno Dias da SILVA, Alcione Rodrigues GOMES, Geórgia Regina 2024-04-01T16:12:44Zoai:ojs.periodicos.puc-campinas.edu.br:article/6056Revistahttp://periodicos.puc-campinas.edu.br/seer/index.php/transinfo/indexPRIhttps://old.scielo.br/oai/scielo-oai.phpsbi.nucleodeeditoracao@puc-campinas.edu.br2318-08890103-3786opendoar:2024-04-01T16:12:44Transinformação (Online) - Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS)false |
dc.title.none.fl_str_mv |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
title |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
spellingShingle |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim Missi XAVIER, Bruno |
title_short |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
title_full |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
title_fullStr |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
title_full_unstemmed |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
title_sort |
Uma arquitetura hibrida para a indexação de documentos do Diário Oficial do Município de Cachoeiro de Itapemirim |
author |
Missi XAVIER, Bruno |
author_facet |
Missi XAVIER, Bruno Dias da SILVA, Alcione Rodrigues GOMES, Geórgia Regina |
author_role |
author |
author2 |
Dias da SILVA, Alcione Rodrigues GOMES, Geórgia Regina |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Missi XAVIER, Bruno Dias da SILVA, Alcione Rodrigues GOMES, Geórgia Regina |
description |
Text mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of Cachoeiro de Itapemirim in the state of Espírito Santo, transforming the information previously available in natural language into a structured format that can be persisted. To validate the architecture we developed a prototype in Java accessible in the Web environment to evaluate the tool. To evaluate the tool, a case study featured a database composed of 22 documents, containing 198 normative acts from the database of the Official Gazette, in which good levels of accuracy and coverage of information retrieval were identified. This study contributes to the presentation of a hybrid architecture consisting of components of the model of transactional systems and elements of text mining, in addition to the use of software design patterns. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-03-25 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Peer-reviewed Article Artículo revisado por pares Avaliado pelos Pares |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056 |
url |
https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.puc-campinas.edu.br/transinfo/article/view/6056/3780 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2022 Transinformação https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2022 Transinformação https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Núcleo de Editoração - PUC-Campinas |
publisher.none.fl_str_mv |
Núcleo de Editoração - PUC-Campinas |
dc.source.none.fl_str_mv |
Transinformação; Vol. 27 No. 1 (2015) Transinformação; Vol. 27 Núm. 1 (2015) Transinformação; v. 27 n. 1 (2015) 2318-0889 0103-3786 reponame:Transinformação (Online) instname:Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS) instacron:PUC_CAMP |
instname_str |
Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS) |
instacron_str |
PUC_CAMP |
institution |
PUC_CAMP |
reponame_str |
Transinformação (Online) |
collection |
Transinformação (Online) |
repository.name.fl_str_mv |
Transinformação (Online) - Pontifícia Universidade Católica de Campinas (PUC-CAMPINAS) |
repository.mail.fl_str_mv |
sbi.nucleodeeditoracao@puc-campinas.edu.br |
_version_ |
1799125985037123584 |