Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | https://app.uff.br/riuff/handle/1/10669 |
Resumo: | Em domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização. |
id |
UFF-2_dfacf76de9bc28e29c877c436f7fabad |
---|---|
oai_identifier_str |
oai:app.uff.br:1/10669 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literaturaRecuperação de informaçãoMineração de dadosInterface de buscaDocumento digitalDocumento eletrônicoRecuperação da informaçãoInterface de usuário (Sistema de computador)Web semânticaInformation RetrievalDataminingSearch InterfaceDigital documentEm domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização.Inter-disciplinary fields such as Communication and Health Information, the emergence of the Web has brought an increasing availability of digital documents as diverse as scientific articles, news, legislation, manuals, standards, etc.., of potential interest. Given the large number and dispersion of these documents from different sources, their automatic treatment in order to reuse and recontextualization in the interests and semantics of a specific domain is of great interest. This study aimed to investigate the ability to identify and analyze methods for automatically extracting specific semantics from digital texts in order to reuse them for other purposes than that which they were first produced. It had been collected and classified papers seeking to answer the following questions: Which set of textual data with the method described in the article was applied? and semantics as specified was to be sought in the set of textual data?. After the analysis, for each text identified in the survey yielded the following classes of methods: Text mining, Semantic Annotation, Semantic Analysis, Natural Language Analysis and Statistical Treatment of texts. It presents a systematic relationship which describes the general characteristics of each method, the class formed by him, and items that compose each class are discussed and commented. It is hoped that the research will support proposals for systems of automatic processing of texts published on the Web with a view to their reuse and re-contextualization.100f.Marcondes, Carlos HenriqueBarçante, Eduardo2019-08-02T17:02:16Z2019-08-02T17:02:16Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://app.uff.br/riuff/handle/1/10669Aluno de MestradoCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-01-26T12:25:04Zoai:app.uff.br:1/10669Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T10:47:39.926323Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
title |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
spellingShingle |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura Barçante, Eduardo Recuperação de informação Mineração de dados Interface de busca Documento digital Documento eletrônico Recuperação da informação Interface de usuário (Sistema de computador) Web semântica Information Retrieval Datamining Search Interface Digital document |
title_short |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
title_full |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
title_fullStr |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
title_full_unstemmed |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
title_sort |
Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura |
author |
Barçante, Eduardo |
author_facet |
Barçante, Eduardo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Marcondes, Carlos Henrique |
dc.contributor.author.fl_str_mv |
Barçante, Eduardo |
dc.subject.por.fl_str_mv |
Recuperação de informação Mineração de dados Interface de busca Documento digital Documento eletrônico Recuperação da informação Interface de usuário (Sistema de computador) Web semântica Information Retrieval Datamining Search Interface Digital document |
topic |
Recuperação de informação Mineração de dados Interface de busca Documento digital Documento eletrônico Recuperação da informação Interface de usuário (Sistema de computador) Web semântica Information Retrieval Datamining Search Interface Digital document |
description |
Em domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização. |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011 2019-08-02T17:02:16Z 2019-08-02T17:02:16Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://app.uff.br/riuff/handle/1/10669 Aluno de Mestrado |
url |
https://app.uff.br/riuff/handle/1/10669 |
identifier_str_mv |
Aluno de Mestrado |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823571183337472 |