Processamento de Linguagem Natural e Extração de Conhecimento
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/35676 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra |
id |
RCAP_15321961a0fc9238d900950600bb6d2e |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/35676 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Processamento de Linguagem Natural e Extração de ConhecimentoProcessamento de Linguagem NaturalExtração de OpiniõesRedes SociaisAprendizagem AutomáticaExtração de InformaçãoText MiningDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de CoimbraA opinião de outras pessoas sempre foi um dado relevante no processo de tomada de decisão. Com o aparecimento da Internet, em especial das redes sociais, a quantidade de comentários de utilizadores sobre a qualidade de serviços e produtos aumentou exponencialmente. Sendo que esta informação começou a ter cada vez mais relev ância para os utilizadores que antes de tomarem uma decisão sobre um serviço ou um produto procuram ter mais informação dos comentários e opiniões de outros. A in uência que as opiniões das outras pessoas exercem tem feito aumentar o interesse nas ferramentas de análise de opiniões. Muitas vezes essas opiniões são publicadas em redes sociais em que o tipo de texto presente é geralmente não estruturado, apresentando diversos desa os de análise. O presente trabalho propõe um conjunto de ferramentas capazes de extrair informa ção de texto que contenha opiniões, recorrendo a técnicas de Processamento de Linguagem Natural e abordagens de Text Mining. Como tal, foi desenvolvida uma biblioteca com um conjunto de ferramentas necessárias para a análise de opiniões. O trabalho foca-se em texto extraído de redes sociais, que se caracteriza como sendo um texto não estruturado, menos cuidado, com abreviaturas, pitês e muitas vezes não respeita as regras ortográ cas e sintáticas. Todas as ferramentas desenvolvidas permitem a análise de texto escrito na Língua Inglesa bem como na Língua Portuguesa. Para além do tipo de texto que se analisa, um dos principais desa os foi o desenvolvimento das ferramentas para a Língua Portuguesa, uma vez que existem relativamente menos recursos disponíveis, o que se re etiu nos resultados obtidos que foram sempre inferiores aos alcançados na Língua Inglesa. Todas as ferramentas aqui desenvolvidas estão integradas com a plataforma Wiz- dee preparadas para serem usadas em produtos comerciais.The opinion of others has always been an important element in the process of making decisions. With the advent of the Internet, and in particularly, social networks, the amount of comments from users, regarding the quality of services and products, has increased exponentially. Following this, information began to have an increasing importance for users. Now, a user looks for more information before making a decision about a service or product, by using reviews and the opinions of others. The in uence that the opinion of others exert, resulted in an increasing interest for tools capable of opinion mining. Often, we can nd these opinions on social networks, where the challenge of unstructured text must be dealt. The work presented in this thesis proposes a set of tools to extract information from subjective text, using Natural Language Processing techniques and Text Mining approaches. As such, a library containing a set of tools for opinion mining was developed. The supported languages are English and Portuguese. As mentioned, the work focuses on text extracted from social networks, which is characterized as being unstructured text. Often it does not respect the syntactic rules of the language and contains spelling errors. Furthermore, while there are challenges concerning the handling of unstructured text in both languages, one of the major challenges was the development of tools for the Portuguese language, since there are relatively fewer resources available. This was re ected in the results, where the Portuguese results were always lower than those achieved by the English tools. All tools developed during this project are integrated with the platform Wizdee and are prepared for its use in commercial products.2015-07-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/35676http://hdl.handle.net/10316/35676TID:201538105porPinto, Sara Catarina Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T04:32:47Zoai:estudogeral.uc.pt:10316/35676Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:54:24.614868Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Processamento de Linguagem Natural e Extração de Conhecimento |
title |
Processamento de Linguagem Natural e Extração de Conhecimento |
spellingShingle |
Processamento de Linguagem Natural e Extração de Conhecimento Pinto, Sara Catarina Silva Processamento de Linguagem Natural Extração de Opiniões Redes Sociais Aprendizagem Automática Extração de Informação Text Mining |
title_short |
Processamento de Linguagem Natural e Extração de Conhecimento |
title_full |
Processamento de Linguagem Natural e Extração de Conhecimento |
title_fullStr |
Processamento de Linguagem Natural e Extração de Conhecimento |
title_full_unstemmed |
Processamento de Linguagem Natural e Extração de Conhecimento |
title_sort |
Processamento de Linguagem Natural e Extração de Conhecimento |
author |
Pinto, Sara Catarina Silva |
author_facet |
Pinto, Sara Catarina Silva |
author_role |
author |
dc.contributor.author.fl_str_mv |
Pinto, Sara Catarina Silva |
dc.subject.por.fl_str_mv |
Processamento de Linguagem Natural Extração de Opiniões Redes Sociais Aprendizagem Automática Extração de Informação Text Mining |
topic |
Processamento de Linguagem Natural Extração de Opiniões Redes Sociais Aprendizagem Automática Extração de Informação Text Mining |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-07-13 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/35676 http://hdl.handle.net/10316/35676 TID:201538105 |
url |
http://hdl.handle.net/10316/35676 |
identifier_str_mv |
TID:201538105 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133831175864320 |