Towards improving WEBSOM with multi-word expressions
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/10169 |
Resumo: | Dissertação para obtenção do Grau de Mestre em Engenharia Informática |
id |
RCAP_0d5b67d1920e73598f7551c673977357 |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/10169 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Towards improving WEBSOM with multi-word expressionsSelf-Organising Maps (SOM)Text miningWEBSOMRelevant expressionsDissertação para obtenção do Grau de Mestre em Engenharia InformáticaLarge quantities of free-text documents are usually rich in information and covers several topics. However, since their dimension is very large, searching and filtering data is an exhaustive task. A large text collection covers a set of topics where each topic is affiliated to a group of documents. This thesis presents a method for building a document map about the core contents covered in the collection. WEBSOM is an approach that combines document encoding methods and Self-Organising Maps (SOM) to generate a document map. However, this methodology has a weakness in the document encoding method because it uses single words to characterise documents. Single words tend to be ambiguous and semantically vague, so some documents can be incorrectly related. This thesis proposes a new document encoding method to improve the WEBSOM approach by using multi word expressions (MWEs) to describe documents. Previous research and ongoing experiments encourage us to use MWEs to characterise documents because these are semantically more accurate than single words and more descriptive.Faculdade de Ciências e TecnologiaMarques, Nuno CavalheiroSilva, JoaquimRUNAlves, Stefan Eduard Raposo2013-07-23T15:21:47Z20132013-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/10169enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T03:43:44Zoai:run.unl.pt:10362/10169Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:19:17.262478Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Towards improving WEBSOM with multi-word expressions |
title |
Towards improving WEBSOM with multi-word expressions |
spellingShingle |
Towards improving WEBSOM with multi-word expressions Alves, Stefan Eduard Raposo Self-Organising Maps (SOM) Text mining WEBSOM Relevant expressions |
title_short |
Towards improving WEBSOM with multi-word expressions |
title_full |
Towards improving WEBSOM with multi-word expressions |
title_fullStr |
Towards improving WEBSOM with multi-word expressions |
title_full_unstemmed |
Towards improving WEBSOM with multi-word expressions |
title_sort |
Towards improving WEBSOM with multi-word expressions |
author |
Alves, Stefan Eduard Raposo |
author_facet |
Alves, Stefan Eduard Raposo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Marques, Nuno Cavalheiro Silva, Joaquim RUN |
dc.contributor.author.fl_str_mv |
Alves, Stefan Eduard Raposo |
dc.subject.por.fl_str_mv |
Self-Organising Maps (SOM) Text mining WEBSOM Relevant expressions |
topic |
Self-Organising Maps (SOM) Text mining WEBSOM Relevant expressions |
description |
Dissertação para obtenção do Grau de Mestre em Engenharia Informática |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-07-23T15:21:47Z 2013 2013-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/10169 |
url |
http://hdl.handle.net/10362/10169 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Faculdade de Ciências e Tecnologia |
publisher.none.fl_str_mv |
Faculdade de Ciências e Tecnologia |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137836798050304 |