Towards improving WEBSOM with multi-word expressions

Detalhes bibliográficos
Autor(a) principal: Alves, Stefan Eduard Raposo
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/10169
Resumo: Dissertação para obtenção do Grau de Mestre em Engenharia Informática
id RCAP_0d5b67d1920e73598f7551c673977357
oai_identifier_str oai:run.unl.pt:10362/10169
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Towards improving WEBSOM with multi-word expressionsSelf-Organising Maps (SOM)Text miningWEBSOMRelevant expressionsDissertação para obtenção do Grau de Mestre em Engenharia InformáticaLarge quantities of free-text documents are usually rich in information and covers several topics. However, since their dimension is very large, searching and filtering data is an exhaustive task. A large text collection covers a set of topics where each topic is affiliated to a group of documents. This thesis presents a method for building a document map about the core contents covered in the collection. WEBSOM is an approach that combines document encoding methods and Self-Organising Maps (SOM) to generate a document map. However, this methodology has a weakness in the document encoding method because it uses single words to characterise documents. Single words tend to be ambiguous and semantically vague, so some documents can be incorrectly related. This thesis proposes a new document encoding method to improve the WEBSOM approach by using multi word expressions (MWEs) to describe documents. Previous research and ongoing experiments encourage us to use MWEs to characterise documents because these are semantically more accurate than single words and more descriptive.Faculdade de Ciências e TecnologiaMarques, Nuno CavalheiroSilva, JoaquimRUNAlves, Stefan Eduard Raposo2013-07-23T15:21:47Z20132013-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/10169enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T03:43:44Zoai:run.unl.pt:10362/10169Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:19:17.262478Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Towards improving WEBSOM with multi-word expressions
title Towards improving WEBSOM with multi-word expressions
spellingShingle Towards improving WEBSOM with multi-word expressions
Alves, Stefan Eduard Raposo
Self-Organising Maps (SOM)
Text mining
WEBSOM
Relevant expressions
title_short Towards improving WEBSOM with multi-word expressions
title_full Towards improving WEBSOM with multi-word expressions
title_fullStr Towards improving WEBSOM with multi-word expressions
title_full_unstemmed Towards improving WEBSOM with multi-word expressions
title_sort Towards improving WEBSOM with multi-word expressions
author Alves, Stefan Eduard Raposo
author_facet Alves, Stefan Eduard Raposo
author_role author
dc.contributor.none.fl_str_mv Marques, Nuno Cavalheiro
Silva, Joaquim
RUN
dc.contributor.author.fl_str_mv Alves, Stefan Eduard Raposo
dc.subject.por.fl_str_mv Self-Organising Maps (SOM)
Text mining
WEBSOM
Relevant expressions
topic Self-Organising Maps (SOM)
Text mining
WEBSOM
Relevant expressions
description Dissertação para obtenção do Grau de Mestre em Engenharia Informática
publishDate 2013
dc.date.none.fl_str_mv 2013-07-23T15:21:47Z
2013
2013-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/10169
url http://hdl.handle.net/10362/10169
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Faculdade de Ciências e Tecnologia
publisher.none.fl_str_mv Faculdade de Ciências e Tecnologia
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137836798050304