RISO - TT - extração de expressões temporais em textos.

Detalhes bibliográficos
Autor(a) principal: SANTOS, Adriano Araújo.
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263
Resumo: A necessidade de gerenciar a grande quantidade de documentos digitais existentes na atualidade, associada à incapacidade humana de analisar todas essas informações em tempo hábil, fez com que as pesquisas e o desenvolvimento de sistemas na área de automatização de processos para a gestão de informação crescessem, no entanto, essa atividade não é trivial. A maioria dos documentos disponíveis não tem estrutura bem definida (padronizada), o que torna difícil a criação de mecanismos computacionais que automatizem a análise das informações e gera a necessidade de se promoverem atividades intermediárias de conversão de informações em linguagem natural em informações estruturadas. Para isso, são necessárias atividades de reconhecimento de padrões nominais, temporais e espaciais. No tocante a essa pesquisa, o objetivo principal foi criar um mecanismo de reconhecimento de padrões temporais. Heuristicamente, foi criado um dicionário de regras baseadas em associações de padrões temporais e desenvolvido um módulo de marcação e recuperação de padrões temporais em uma arquitetura extensível e flexível, chamado RISO-TT, que implementa esse mecanismo de reconhecimento de padrões temporais. Esse módulo faz parte do projeto de pesquisa RISO (Recuperação da Informação Semântica de Objetos Textuais). Foram realizados dois experimentos para avaliar a eficiência do RISO-TT. O primeiro, com o intuito de verificar a extensibilidade e a flexibilidade do módulo RISO-TT, e o segundo, para analisar a eficiência da abordagem proposta com base em uma comparação com duas ferramentas consolidadas no meio académico (HeidelTime e SuTime). O RISO-TT obteve resultados superiores aos concorrentes no processo de marcação de expressões temporais, comprovados por meio de testes estatísticos.
id UFCG_aa667c918b002b194f92a061574344e3
oai_identifier_str oai:localhost:riufcg/1263
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling RISO - TT - extração de expressões temporais em textos.RISO - TT - extraction of temporal expressions in texts.Extração TemporalReconhecimento de Padrões TemporaisProcessamento de Linguagem NaturalRecuperação da InformaçãoLinguagem NaturalReconhecimento de Padrões NominaisReconhecimento de Padrões EspaciaisRISO-TTRecuperação da Informação SemânticaInformation RetrievalVocabulários TemáticosIndexação da InformaçãoConsulta SemânticaGestão da InformaçãoInformáticaCiência da InformaçãoA necessidade de gerenciar a grande quantidade de documentos digitais existentes na atualidade, associada à incapacidade humana de analisar todas essas informações em tempo hábil, fez com que as pesquisas e o desenvolvimento de sistemas na área de automatização de processos para a gestão de informação crescessem, no entanto, essa atividade não é trivial. A maioria dos documentos disponíveis não tem estrutura bem definida (padronizada), o que torna difícil a criação de mecanismos computacionais que automatizem a análise das informações e gera a necessidade de se promoverem atividades intermediárias de conversão de informações em linguagem natural em informações estruturadas. Para isso, são necessárias atividades de reconhecimento de padrões nominais, temporais e espaciais. No tocante a essa pesquisa, o objetivo principal foi criar um mecanismo de reconhecimento de padrões temporais. Heuristicamente, foi criado um dicionário de regras baseadas em associações de padrões temporais e desenvolvido um módulo de marcação e recuperação de padrões temporais em uma arquitetura extensível e flexível, chamado RISO-TT, que implementa esse mecanismo de reconhecimento de padrões temporais. Esse módulo faz parte do projeto de pesquisa RISO (Recuperação da Informação Semântica de Objetos Textuais). Foram realizados dois experimentos para avaliar a eficiência do RISO-TT. O primeiro, com o intuito de verificar a extensibilidade e a flexibilidade do módulo RISO-TT, e o segundo, para analisar a eficiência da abordagem proposta com base em uma comparação com duas ferramentas consolidadas no meio académico (HeidelTime e SuTime). O RISO-TT obteve resultados superiores aos concorrentes no processo de marcação de expressões temporais, comprovados por meio de testes estatísticos.The necessity of managing the large amount of digital existing documents nowadays, associated to the human inability to analyze ali this information in a fast manner, led to a growth of research in the area of system development for automation of the information management process. Nevertheless, this is not a trivial task. Most of the available documents do not have a standardized structure, hindering the development of computational schemes that can automate the analysis of information, thus requiring jobs of information conversion from natural language to structured information. For such, syntactic, temporal and spatial pattern recognition tasks are needed. Concerning the present study, the main objective is to create an advanced temporal pattern recognition mechanism. We created, heurístically, a rules dictionary of temporal patterns, developing a module in an extendable and flexible architecture for retrieval and marking. This module, called RISO-TT, implements this pattern recognition mechanism and is part of the RISO project (Retrieval of Semantic Information from Textual Objects). Two experiments were carried out in order to evaluate the efficiency of this approach. The first one was intended to verify the extendability and flexibility of the RISO-TT architecture and the second one to analyze the efficiency of the proposed approach, based on a comparison between the developed module and two Consolidated tools in the academic community (Heideltime and SuTime). RISO-TT outperformed the rivais in the temporal expression marking process, which was proved through statistical tests.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGSCHIEL, Ulrich.SCHIEL, U.http://lattes.cnpq.br/2971250918247087PIRES, Carlos Eduardo Santos.BEZERRA, Ed Porto.SANTOS, Adriano Araújo.2013-04-222018-07-26T15:09:11Z2018-07-262018-07-26T15:09:11Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263SANTOS, Adriano Araújo. RISO- TT - extração de expressões temporais em textos. 2013. 86 f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraiba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-21T20:20:31Zoai:localhost:riufcg/1263Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-21T20:20:31Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv RISO - TT - extração de expressões temporais em textos.
RISO - TT - extraction of temporal expressions in texts.
title RISO - TT - extração de expressões temporais em textos.
spellingShingle RISO - TT - extração de expressões temporais em textos.
SANTOS, Adriano Araújo.
Extração Temporal
Reconhecimento de Padrões Temporais
Processamento de Linguagem Natural
Recuperação da Informação
Linguagem Natural
Reconhecimento de Padrões Nominais
Reconhecimento de Padrões Espaciais
RISO-TT
Recuperação da Informação Semântica
Information Retrieval
Vocabulários Temáticos
Indexação da Informação
Consulta Semântica
Gestão da Informação
Informática
Ciência da Informação
title_short RISO - TT - extração de expressões temporais em textos.
title_full RISO - TT - extração de expressões temporais em textos.
title_fullStr RISO - TT - extração de expressões temporais em textos.
title_full_unstemmed RISO - TT - extração de expressões temporais em textos.
title_sort RISO - TT - extração de expressões temporais em textos.
author SANTOS, Adriano Araújo.
author_facet SANTOS, Adriano Araújo.
author_role author
dc.contributor.none.fl_str_mv SCHIEL, Ulrich.
SCHIEL, U.
http://lattes.cnpq.br/2971250918247087
PIRES, Carlos Eduardo Santos.
BEZERRA, Ed Porto.
dc.contributor.author.fl_str_mv SANTOS, Adriano Araújo.
dc.subject.por.fl_str_mv Extração Temporal
Reconhecimento de Padrões Temporais
Processamento de Linguagem Natural
Recuperação da Informação
Linguagem Natural
Reconhecimento de Padrões Nominais
Reconhecimento de Padrões Espaciais
RISO-TT
Recuperação da Informação Semântica
Information Retrieval
Vocabulários Temáticos
Indexação da Informação
Consulta Semântica
Gestão da Informação
Informática
Ciência da Informação
topic Extração Temporal
Reconhecimento de Padrões Temporais
Processamento de Linguagem Natural
Recuperação da Informação
Linguagem Natural
Reconhecimento de Padrões Nominais
Reconhecimento de Padrões Espaciais
RISO-TT
Recuperação da Informação Semântica
Information Retrieval
Vocabulários Temáticos
Indexação da Informação
Consulta Semântica
Gestão da Informação
Informática
Ciência da Informação
description A necessidade de gerenciar a grande quantidade de documentos digitais existentes na atualidade, associada à incapacidade humana de analisar todas essas informações em tempo hábil, fez com que as pesquisas e o desenvolvimento de sistemas na área de automatização de processos para a gestão de informação crescessem, no entanto, essa atividade não é trivial. A maioria dos documentos disponíveis não tem estrutura bem definida (padronizada), o que torna difícil a criação de mecanismos computacionais que automatizem a análise das informações e gera a necessidade de se promoverem atividades intermediárias de conversão de informações em linguagem natural em informações estruturadas. Para isso, são necessárias atividades de reconhecimento de padrões nominais, temporais e espaciais. No tocante a essa pesquisa, o objetivo principal foi criar um mecanismo de reconhecimento de padrões temporais. Heuristicamente, foi criado um dicionário de regras baseadas em associações de padrões temporais e desenvolvido um módulo de marcação e recuperação de padrões temporais em uma arquitetura extensível e flexível, chamado RISO-TT, que implementa esse mecanismo de reconhecimento de padrões temporais. Esse módulo faz parte do projeto de pesquisa RISO (Recuperação da Informação Semântica de Objetos Textuais). Foram realizados dois experimentos para avaliar a eficiência do RISO-TT. O primeiro, com o intuito de verificar a extensibilidade e a flexibilidade do módulo RISO-TT, e o segundo, para analisar a eficiência da abordagem proposta com base em uma comparação com duas ferramentas consolidadas no meio académico (HeidelTime e SuTime). O RISO-TT obteve resultados superiores aos concorrentes no processo de marcação de expressões temporais, comprovados por meio de testes estatísticos.
publishDate 2013
dc.date.none.fl_str_mv 2013-04-22
2018-07-26T15:09:11Z
2018-07-26
2018-07-26T15:09:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263
SANTOS, Adriano Araújo. RISO- TT - extração de expressões temporais em textos. 2013. 86 f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraiba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263
identifier_str_mv SANTOS, Adriano Araújo. RISO- TT - extração de expressões temporais em textos. 2013. 86 f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraiba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744355814014976