[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Outros |
Idioma: | por |
Título da fonte: | Repositório Institucional da PUC-RIO (Projeto Maxwell) |
Texto Completo: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2 http://doi.org/10.17771/PUCRio.acad.23213 |
Resumo: | [pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil. |
id |
PUC_RIO-1_f0fd39128215ce4024aace1cb6cf3fa3 |
---|---|
oai_identifier_str |
oai:MAXWELL.puc-rio.br:23213 |
network_acronym_str |
PUC_RIO-1 |
network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository_id_str |
534 |
spelling |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS [pt] FRAMEWORK[pt] CATEGORIZACAO[pt] AUTOMATICA[pt] PORTUGUES BRASILEIRO[pt] MINERACAO DE TEXTO[en] FRAMEWORK[en] CATEGORIZATION[en] AUTOMATIC[en] BRAZILIAN PORTUGUESE[en] TEXT MINING[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.[en] Text Categorization, one of the tasks performed in Text Mining, can be described as the achievement of a function that is able to assign a document to the category, previously defined, to which it belongs. The main goal of building a taxonomy of documents is to make easier obtaining relevant information. However, the implementation and execution of Text Categorization is not a trivial task: Text Mining tools are under development and still require high technical expertise to be handled, also having great significance in a Text Mining process, the language of the documents should be treated with the peculiarities of each idiom. Yet there is great need for tools that provide proper handling to Portuguese of Brazil. Thus, the main aims of this work are to research, propose, implement and evaluate a Text Mining Framework for Automatic Text Categorization, capable of assisting the execution of knowledge discovery process and provides language processing for Brazilian Portuguese.MAXWELLMARLEY MARIA BERNARDES REBUZZI VELLASCOMARLEY MARIA BERNARDES REBUZZI VELLASCOFABIO DE AZEVEDO SOARES2014-07-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2http://doi.org/10.17771/PUCRio.acad.23213porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2019-08-14T00:00:00Zoai:MAXWELL.puc-rio.br:23213Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-08-14T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
dc.title.none.fl_str_mv |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS |
title |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING |
spellingShingle |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING FABIO DE AZEVEDO SOARES [pt] FRAMEWORK [pt] CATEGORIZACAO [pt] AUTOMATICA [pt] PORTUGUES BRASILEIRO [pt] MINERACAO DE TEXTO [en] FRAMEWORK [en] CATEGORIZATION [en] AUTOMATIC [en] BRAZILIAN PORTUGUESE [en] TEXT MINING |
title_short |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING |
title_full |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING |
title_fullStr |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING |
title_full_unstemmed |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING |
title_sort |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING |
author |
FABIO DE AZEVEDO SOARES |
author_facet |
FABIO DE AZEVEDO SOARES |
author_role |
author |
dc.contributor.none.fl_str_mv |
MARLEY MARIA BERNARDES REBUZZI VELLASCO MARLEY MARIA BERNARDES REBUZZI VELLASCO |
dc.contributor.author.fl_str_mv |
FABIO DE AZEVEDO SOARES |
dc.subject.por.fl_str_mv |
[pt] FRAMEWORK [pt] CATEGORIZACAO [pt] AUTOMATICA [pt] PORTUGUES BRASILEIRO [pt] MINERACAO DE TEXTO [en] FRAMEWORK [en] CATEGORIZATION [en] AUTOMATIC [en] BRAZILIAN PORTUGUESE [en] TEXT MINING |
topic |
[pt] FRAMEWORK [pt] CATEGORIZACAO [pt] AUTOMATICA [pt] PORTUGUES BRASILEIRO [pt] MINERACAO DE TEXTO [en] FRAMEWORK [en] CATEGORIZATION [en] AUTOMATIC [en] BRAZILIAN PORTUGUESE [en] TEXT MINING |
description |
[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil. |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-07-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/other |
format |
other |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2 http://doi.org/10.17771/PUCRio.acad.23213 |
url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2 http://doi.org/10.17771/PUCRio.acad.23213 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
MAXWELL |
publisher.none.fl_str_mv |
MAXWELL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
instacron_str |
PUC_RIO |
institution |
PUC_RIO |
reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
repository.mail.fl_str_mv |
|
_version_ |
1814822588272082944 |