Anotação automática de textos para análise e identificação de conteúdo

Detalhes bibliográficos
Autor(a) principal: Santos, Tiago Miguel Fraga
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/83936
Resumo: Dissertação de mestrado integrado em Engenharia Informática
id RCAP_b6af7b3899391663e7fdbf783271947a
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/83936
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Anotação automática de textos para análise e identificação de conteúdoAnnotation systemsAutomomatic taggingData analysisText miningNatural language processingMachine LearningSistemas de anotaçãoTagging automáticoAnálise de dadosText MiningProcessamento de linguagem naturalEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Engenharia InformáticaAutomatic text annotation systems are mechanisms that aim to provide assistance to users who need to extract and annotate relevant information in a given text. Usually, this type of system is developed for very specific application domains, in order to facilitate research processes on text content. The works of this dissertation will be developed based on the Tombo da Mitra, a codex that contains the inventory of the properties of the Archbishop’s Table of Braga, in the 17th century. The quantity and diversity of the elements referred to in the book are impressive, as it contains all the names and surnames, settlements, professions, types of land and buildings, among many other elements, which are very important for the study and learning of geography, culture, economy, architecture, religion and portuguese language of the 17th century. The annotation of these elements expressively shows their location in time and space, as well as their potential relationships, facilitating the study of the book and providing linguistic researchers, teachers and students with a valuable instrument to reach and reinforce knowledge about the book. In this dissertation, we present a tool specially designed for the annotation of documents in the Livro das Propriedades, allowing the management and listing of annotation tags and providing a clearer view of the content of the manuscript.Os sistemas de anotação automática de textos são mecanismos que visam prestar auxílio a utilizadores que necessitem de extrair e anotar informação relevante num dado texto. Usualmente, este tipo de sistema e desenvolvido para domínios de aplicação bastante específicos, com vista a facilitar processos de pesquisa sobre conteúdos de textos. Os trabalhos da presente dissertação foram desenvolvidos com base no Tombo da Mitra, um códice que contém o inventário das propriedades da Mesa Arcebispal de Braga, no século XVII. A quantidade e diversidade dos elementos referidos no livro são impressionantes, uma vez que este contém nomes, apelidos, povoações, profissões, tipos de terrenos e edificações, entre tantos outros elementos, que são muito importantes para o estudo e aprendizagem da geografia, cultura, economia, arquitetura, religião e língua portuguesa até ao século XVII. A anotação destes elementos evidencia de forma expressiva a sua localização no tempo e no espaço, bem como as suas potenciais relações, facilitando o estudo do livro e proporcionando aos investigadores, linguistas, professores e alunos, um valioso instrumento para alcançar e reforçar o conhecimento sobre o manuscrito. Nesta dissertação, apresentamos uma ferramenta que foi concebida especialmente para a anotação dos documentos do Livro de Propriedades, que permite gerir e relacionar as etiquetas de anotação e proporcionar uma visão mais clara do conteúdo do referido manuscrito.Belo, OrlandoBarros, Anabela Leal deUniversidade do MinhoSantos, Tiago Miguel Fraga2022-11-282022-11-28T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/83936por203251792info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:31:49Zoai:repositorium.sdum.uminho.pt:1822/83936Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:27:05.794893Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Anotação automática de textos para análise e identificação de conteúdo
title Anotação automática de textos para análise e identificação de conteúdo
spellingShingle Anotação automática de textos para análise e identificação de conteúdo
Santos, Tiago Miguel Fraga
Annotation systems
Automomatic tagging
Data analysis
Text mining
Natural language processing
Machine Learning
Sistemas de anotação
Tagging automático
Análise de dados
Text Mining
Processamento de linguagem natural
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Anotação automática de textos para análise e identificação de conteúdo
title_full Anotação automática de textos para análise e identificação de conteúdo
title_fullStr Anotação automática de textos para análise e identificação de conteúdo
title_full_unstemmed Anotação automática de textos para análise e identificação de conteúdo
title_sort Anotação automática de textos para análise e identificação de conteúdo
author Santos, Tiago Miguel Fraga
author_facet Santos, Tiago Miguel Fraga
author_role author
dc.contributor.none.fl_str_mv Belo, Orlando
Barros, Anabela Leal de
Universidade do Minho
dc.contributor.author.fl_str_mv Santos, Tiago Miguel Fraga
dc.subject.por.fl_str_mv Annotation systems
Automomatic tagging
Data analysis
Text mining
Natural language processing
Machine Learning
Sistemas de anotação
Tagging automático
Análise de dados
Text Mining
Processamento de linguagem natural
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Annotation systems
Automomatic tagging
Data analysis
Text mining
Natural language processing
Machine Learning
Sistemas de anotação
Tagging automático
Análise de dados
Text Mining
Processamento de linguagem natural
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado integrado em Engenharia Informática
publishDate 2022
dc.date.none.fl_str_mv 2022-11-28
2022-11-28T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/83936
url https://hdl.handle.net/1822/83936
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203251792
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132761285459968