Classificação e agregação automática de notícias desportivas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/5594 |
Resumo: | Mestrado em Engenharia Informática - Área de Especialização em Arquiteturas, Sistemas e Redes |
id |
RCAP_2e196c6cb89aeb149ef1ec068100c89a |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/5594 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Classificação e agregação automática de notícias desportivasTextoClassificaçãoClusteringNotíciasDesportoTextClassificationNewsSportsMestrado em Engenharia Informática - Área de Especialização em Arquiteturas, Sistemas e RedesEste relatório foi elaborado no âmbito da dissertação para obtenção do Grau de Mestre em Engenharia Informática do Instituto Superior de Engenharia do Porto Foi desenvolvido com vista o auxílio da implementação de um módulo de classificação e agregação (clustering) automática de notícias desportivas. Este módulo será implementado numa aplicação web relacionada com o desporto a ser desenvolvida futuramente. O principal objetivo do trabalho desenvolvido é perceber entre inúmeras possibilidades existentes para classificação e clustering de documentos quais as que melhor se adequam face às exigências necessárias. Aqueles que apresentaram melhores resultados foram os escolhidos para a fase de implementação do módulo de classificação e clustering de notícias. Em primeiro lugar foi realizado um levantamento do estado da arte de forma a se ter conhecimento de todas as possibilidades existentes. Face a essas possibilidades, foram selecionados dois algoritmos para cada um dos temas a abordar. Os algoritmos escolhidos foram aquelas que se verificaram os mais adequados. Para a classificação foram selecionados o Support Vector Machine (SVM) e K-Nearest Neighbors. Para o clustering, algoritmos hierárquicos e o K-means adaptável. Cada uma dessas possibilidades foi devidamente avaliada de forma a perceber quais as melhores soluções face aos problemas propostos. Foi também feita uma breve abordagem à sumarização de documentos, contudo, este é um tema secundário. O principal foco do trabalho desenvolvido é a classificação e clustering de texto. Este trabalho foi feito em cooperação com LIAAD/INESC TEC - Laboratório de Inteligência Artificial e Apoio à Decisão sob a supervisão do Dr. Nuno EscudeiroThis report has been made as part of the Computer Engineering Master’s dissertation from School of Engineering – Polytechnic of Porto. The report has been developed in order to aid the implementation of an automatic process for sports news classification and clustering. That module will be implemented in a web application related with sports. The main goal for this research is to understand among various possibilities which ones fit best given the necessary requirements of the module to be developed. Those who present the best evaluations will be chosen to be implemented in the classification and clustering module. Firstly has been made a survey of the state of the art in order to have knowledge of all possibilities. Given those possibilities, for each topic were selected two algorithms. The chosen algorithms were those that found to be the most suitable. For text categorization were selected the Support Vector Machine (SVM) and the K-Nearest Neighbors (KNN) algorithms. For document clustering, were selected hierarchical algorithms and the adaptable k-means algorithm. Then, each of these possibilities have been properly evaluated in order to understand which are the best solutions. Was also made a brief approach to the documents summarization, however, this is a secondary topic. The main focus of this report is document classification and clustering. This work was made in cooperation with LIAAD/INESC TEC – “Laboratório de Inteligência Artificial e Apoio à Decisão” with supervision of Dr. Nuno EscudeiroInstituto Politécnico do Porto. Instituto Superior de Engenharia do Porto.Escudeiro, NunoRepositório Científico do Instituto Politécnico do PortoAlmeida, André Pinho de2015-02-05T17:07:12Z20142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/5594TID:201815990porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T12:45:42Zoai:recipp.ipp.pt:10400.22/5594Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:26:13.561458Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Classificação e agregação automática de notícias desportivas |
title |
Classificação e agregação automática de notícias desportivas |
spellingShingle |
Classificação e agregação automática de notícias desportivas Almeida, André Pinho de Texto Classificação Clustering Notícias Desporto Text Classification News Sports |
title_short |
Classificação e agregação automática de notícias desportivas |
title_full |
Classificação e agregação automática de notícias desportivas |
title_fullStr |
Classificação e agregação automática de notícias desportivas |
title_full_unstemmed |
Classificação e agregação automática de notícias desportivas |
title_sort |
Classificação e agregação automática de notícias desportivas |
author |
Almeida, André Pinho de |
author_facet |
Almeida, André Pinho de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Escudeiro, Nuno Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Almeida, André Pinho de |
dc.subject.por.fl_str_mv |
Texto Classificação Clustering Notícias Desporto Text Classification News Sports |
topic |
Texto Classificação Clustering Notícias Desporto Text Classification News Sports |
description |
Mestrado em Engenharia Informática - Área de Especialização em Arquiteturas, Sistemas e Redes |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014 2014-01-01T00:00:00Z 2015-02-05T17:07:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/5594 TID:201815990 |
url |
http://hdl.handle.net/10400.22/5594 |
identifier_str_mv |
TID:201815990 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Politécnico do Porto. Instituto Superior de Engenharia do Porto. |
publisher.none.fl_str_mv |
Instituto Politécnico do Porto. Instituto Superior de Engenharia do Porto. |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131356533358592 |