[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING

Detalhes bibliográficos
Autor(a) principal: FABIO DE AZEVEDO SOARES
Data de Publicação: 2014
Tipo de documento: Outros
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2
http://doi.org/10.17771/PUCRio.acad.23213
Resumo: [pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.
id PUC_RIO-1_f0fd39128215ce4024aace1cb6cf3fa3
oai_identifier_str oai:MAXWELL.puc-rio.br:23213
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS [pt] FRAMEWORK[pt] CATEGORIZACAO[pt] AUTOMATICA[pt] PORTUGUES BRASILEIRO[pt] MINERACAO DE TEXTO[en] FRAMEWORK[en] CATEGORIZATION[en] AUTOMATIC[en] BRAZILIAN PORTUGUESE[en] TEXT MINING[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.[en] Text Categorization, one of the tasks performed in Text Mining, can be described as the achievement of a function that is able to assign a document to the category, previously defined, to which it belongs. The main goal of building a taxonomy of documents is to make easier obtaining relevant information. However, the implementation and execution of Text Categorization is not a trivial task: Text Mining tools are under development and still require high technical expertise to be handled, also having great significance in a Text Mining process, the language of the documents should be treated with the peculiarities of each idiom. Yet there is great need for tools that provide proper handling to Portuguese of Brazil. Thus, the main aims of this work are to research, propose, implement and evaluate a Text Mining Framework for Automatic Text Categorization, capable of assisting the execution of knowledge discovery process and provides language processing for Brazilian Portuguese.MAXWELLMARLEY MARIA BERNARDES REBUZZI VELLASCOMARLEY MARIA BERNARDES REBUZZI VELLASCOFABIO DE AZEVEDO SOARES2014-07-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2http://doi.org/10.17771/PUCRio.acad.23213porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2019-08-14T00:00:00Zoai:MAXWELL.puc-rio.br:23213Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-08-14T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
[pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS
title [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
spellingShingle [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
FABIO DE AZEVEDO SOARES
[pt] FRAMEWORK
[pt] CATEGORIZACAO
[pt] AUTOMATICA
[pt] PORTUGUES BRASILEIRO
[pt] MINERACAO DE TEXTO
[en] FRAMEWORK
[en] CATEGORIZATION
[en] AUTOMATIC
[en] BRAZILIAN PORTUGUESE
[en] TEXT MINING
title_short [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_full [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_fullStr [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_full_unstemmed [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_sort [en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
author FABIO DE AZEVEDO SOARES
author_facet FABIO DE AZEVEDO SOARES
author_role author
dc.contributor.none.fl_str_mv MARLEY MARIA BERNARDES REBUZZI VELLASCO
MARLEY MARIA BERNARDES REBUZZI VELLASCO
dc.contributor.author.fl_str_mv FABIO DE AZEVEDO SOARES
dc.subject.por.fl_str_mv [pt] FRAMEWORK
[pt] CATEGORIZACAO
[pt] AUTOMATICA
[pt] PORTUGUES BRASILEIRO
[pt] MINERACAO DE TEXTO
[en] FRAMEWORK
[en] CATEGORIZATION
[en] AUTOMATIC
[en] BRAZILIAN PORTUGUESE
[en] TEXT MINING
topic [pt] FRAMEWORK
[pt] CATEGORIZACAO
[pt] AUTOMATICA
[pt] PORTUGUES BRASILEIRO
[pt] MINERACAO DE TEXTO
[en] FRAMEWORK
[en] CATEGORIZATION
[en] AUTOMATIC
[en] BRAZILIAN PORTUGUESE
[en] TEXT MINING
description [pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.
publishDate 2014
dc.date.none.fl_str_mv 2014-07-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/other
format other
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2
http://doi.org/10.17771/PUCRio.acad.23213
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2
http://doi.org/10.17771/PUCRio.acad.23213
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1814822588272082944