Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura

Detalhes bibliográficos
Autor(a) principal: Barçante, Eduardo
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: https://app.uff.br/riuff/handle/1/10669
Resumo: Em domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização.
id UFF-2_dfacf76de9bc28e29c877c436f7fabad
oai_identifier_str oai:app.uff.br:1/10669
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literaturaRecuperação de informaçãoMineração de dadosInterface de buscaDocumento digitalDocumento eletrônicoRecuperação da informaçãoInterface de usuário (Sistema de computador)Web semânticaInformation RetrievalDataminingSearch InterfaceDigital documentEm domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização.Inter-disciplinary fields such as Communication and Health Information, the emergence of the Web has brought an increasing availability of digital documents as diverse as scientific articles, news, legislation, manuals, standards, etc.., of potential interest. Given the large number and dispersion of these documents from different sources, their automatic treatment in order to reuse and recontextualization in the interests and semantics of a specific domain is of great interest. This study aimed to investigate the ability to identify and analyze methods for automatically extracting specific semantics from digital texts in order to reuse them for other purposes than that which they were first produced. It had been collected and classified papers seeking to answer the following questions: Which set of textual data with the method described in the article was applied? and semantics as specified was to be sought in the set of textual data?. After the analysis, for each text identified in the survey yielded the following classes of methods: Text mining, Semantic Annotation, Semantic Analysis, Natural Language Analysis and Statistical Treatment of texts. It presents a systematic relationship which describes the general characteristics of each method, the class formed by him, and items that compose each class are discussed and commented. It is hoped that the research will support proposals for systems of automatic processing of texts published on the Web with a view to their reuse and re-contextualization.100f.Marcondes, Carlos HenriqueBarçante, Eduardo2019-08-02T17:02:16Z2019-08-02T17:02:16Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://app.uff.br/riuff/handle/1/10669Aluno de MestradoCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-01-26T12:25:04Zoai:app.uff.br:1/10669Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-01-26T12:25:04Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
title Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
spellingShingle Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
Barçante, Eduardo
Recuperação de informação
Mineração de dados
Interface de busca
Documento digital
Documento eletrônico
Recuperação da informação
Interface de usuário (Sistema de computador)
Web semântica
Information Retrieval
Datamining
Search Interface
Digital document
title_short Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
title_full Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
title_fullStr Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
title_full_unstemmed Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
title_sort Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
author Barçante, Eduardo
author_facet Barçante, Eduardo
author_role author
dc.contributor.none.fl_str_mv Marcondes, Carlos Henrique
dc.contributor.author.fl_str_mv Barçante, Eduardo
dc.subject.por.fl_str_mv Recuperação de informação
Mineração de dados
Interface de busca
Documento digital
Documento eletrônico
Recuperação da informação
Interface de usuário (Sistema de computador)
Web semântica
Information Retrieval
Datamining
Search Interface
Digital document
topic Recuperação de informação
Mineração de dados
Interface de busca
Documento digital
Documento eletrônico
Recuperação da informação
Interface de usuário (Sistema de computador)
Web semântica
Information Retrieval
Datamining
Search Interface
Digital document
description Em domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização.
publishDate 2011
dc.date.none.fl_str_mv 2011
2019-08-02T17:02:16Z
2019-08-02T17:02:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://app.uff.br/riuff/handle/1/10669
Aluno de Mestrado
url https://app.uff.br/riuff/handle/1/10669
identifier_str_mv Aluno de Mestrado
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1802135257753845760