[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING

FABIO DE AZEVEDO SOARES

[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING

Detalhes bibliográficos
Autor(a) principal:	FABIO DE AZEVEDO SOARES
Data de Publicação:	2014
Tipo de documento:	Outros
Idioma:	por
Título da fonte:	Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo:	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2 http://doi.org/10.17771/PUCRio.acad.23213
Resumo:	[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.

Metadados do item

id	PUC_RIO-1_f0fd39128215ce4024aace1cb6cf3fa3
oai_identifier_str	oai:MAXWELL.puc-rio.br:23213
network_acronym_str	PUC_RIO-1
network_name_str	Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str	534
spelling	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS [pt] FRAMEWORK[pt] CATEGORIZACAO[pt] AUTOMATICA[pt] PORTUGUES BRASILEIRO[pt] MINERACAO DE TEXTO[en] FRAMEWORK[en] CATEGORIZATION[en] AUTOMATIC[en] BRAZILIAN PORTUGUESE[en] TEXT MINING[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.[en] Text Categorization, one of the tasks performed in Text Mining, can be described as the achievement of a function that is able to assign a document to the category, previously defined, to which it belongs. The main goal of building a taxonomy of documents is to make easier obtaining relevant information. However, the implementation and execution of Text Categorization is not a trivial task: Text Mining tools are under development and still require high technical expertise to be handled, also having great significance in a Text Mining process, the language of the documents should be treated with the peculiarities of each idiom. Yet there is great need for tools that provide proper handling to Portuguese of Brazil. Thus, the main aims of this work are to research, propose, implement and evaluate a Text Mining Framework for Automatic Text Categorization, capable of assisting the execution of knowledge discovery process and provides language processing for Brazilian Portuguese.MAXWELLMARLEY MARIA BERNARDES REBUZZI VELLASCOMARLEY MARIA BERNARDES REBUZZI VELLASCOFABIO DE AZEVEDO SOARES2014-07-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2http://doi.org/10.17771/PUCRio.acad.23213porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2019-08-14T00:00:00Zoai:MAXWELL.puc-rio.br:23213Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-08-14T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS
title	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
spellingShingle	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING FABIO DE AZEVEDO SOARES [pt] FRAMEWORK [pt] CATEGORIZACAO [pt] AUTOMATICA [pt] PORTUGUES BRASILEIRO [pt] MINERACAO DE TEXTO [en] FRAMEWORK [en] CATEGORIZATION [en] AUTOMATIC [en] BRAZILIAN PORTUGUESE [en] TEXT MINING
title_short	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_full	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_fullStr	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_full_unstemmed	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
title_sort	[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING
author	FABIO DE AZEVEDO SOARES
author_facet	FABIO DE AZEVEDO SOARES
author_role	author
dc.contributor.none.fl_str_mv	MARLEY MARIA BERNARDES REBUZZI VELLASCO MARLEY MARIA BERNARDES REBUZZI VELLASCO
dc.contributor.author.fl_str_mv	FABIO DE AZEVEDO SOARES
dc.subject.por.fl_str_mv	[pt] FRAMEWORK [pt] CATEGORIZACAO [pt] AUTOMATICA [pt] PORTUGUES BRASILEIRO [pt] MINERACAO DE TEXTO [en] FRAMEWORK [en] CATEGORIZATION [en] AUTOMATIC [en] BRAZILIAN PORTUGUESE [en] TEXT MINING
topic	[pt] FRAMEWORK [pt] CATEGORIZACAO [pt] AUTOMATICA [pt] PORTUGUES BRASILEIRO [pt] MINERACAO DE TEXTO [en] FRAMEWORK [en] CATEGORIZATION [en] AUTOMATIC [en] BRAZILIAN PORTUGUESE [en] TEXT MINING
description	[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil.
publishDate	2014
dc.date.none.fl_str_mv	2014-07-15
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/other
format	other
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2 http://doi.org/10.17771/PUCRio.acad.23213
url	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23213@2 http://doi.org/10.17771/PUCRio.acad.23213
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	MAXWELL
publisher.none.fl_str_mv	MAXWELL
dc.source.none.fl_str_mv	reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO
instname_str	Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str	PUC_RIO
institution	PUC_RIO
reponame_str	Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection	Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv	Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_	1814822588272082944

[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING

Registros relacionados