Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária

Detalhes bibliográficos
Autor(a) principal: Nunes, João Filipe da Costa
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/83038
Resumo: Dissertação de mestrado integrado em Informatics Engineering
id RCAP_d802fd2e8fc786dc9c81f86cace4c250
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/83038
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culináriaOntologiasOntology learningExtração semiautomáticaMachine learningNatural language processingPadrões léxico-sintáticosOntologiesSemi-automatic extractionLexical-syntactic patternsEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Informatics EngineeringAs ontologias podem ser descritas como uma estrutura de dados com uma semântica concisa, explícita e central. As ontologias têm sido utilizadas com o intuito de representar um domínio de conhecimento, ou pelo menos parte desse domínio, de forma a que, posteriormente, possam ser efetuadas interrogações sobre si, visando a exploração, de forma equilibrada e sustentada, do conhecimento representado nessa estrutura. Desta forma, facilmente poderá ser descoberto e explorado o conhecimento presente num dado domínio que se pretende representar e descobrir através da utilização deste tipo de estrutura. O processo manual de construção de uma ontologia envolve diversos custos, nos quais se pode destacar, em particular, o custo temporal associado à concepção e implementação de uma ontologia para um grande domínio de conhecimento. É neste contexto que se insere a área da Ontology Learning, na qual são integrados vários métodos de diferentes áreas de machine learning no processo de construção de ontologias, com o intuito de o (semi)automatizar. Dentro das áreas de machine learning poderá ser destacada a área de Natural Language Processing, na qual podemos encontrar um conjunto muito diverso de técnicas que nos permitem identificar e extrair termos/conceitos pertinentes, propriedades e relações a partir de um domínio de conhecimento, representado, por exemplo, na forma de um texto. Dentro das diversas técnicas passíveis de serem aplicadas, pode-se destacar a aplicação de padrões léxico-sintáticos, que visam explorar formalidades linguísticas com o objetivo de retirar pares hiperónimo e hipónimo de maneira a identificar conceitos e relações da ontologia. Esta abordagem foi aplicada num conjunto de textos antigos de culinária, agricultura e medicina dos séculos XVI e XVII, escritos em Português antigo. Após termos criado a ontologia, desenvolvemos um sistema capaz de explorar o conhecimento que ela contém, dando particular atenção à exploração dos diferentes remédios, dos ingredientes que compõem estes remédios, e dos processos de preparação desses mesmos ingredientes. Com este sistema, facultámos uma maneira simples e intuitiva de explorar o conhecimento presente nos diversos medicamentos representados e caraterizados na ontologia desenvolvida.Ontologies can be described as a data structure with concise, explicit, and central semantics. Ontologies have been used in order to represent a knowledge domain, or at least part of that domain, so that later queries can be made over itself, that aim to explore, in a balanced and sustained way, the knowledge represented in this structure. By using this structure, the knowledge that is represented in a certain domain can easily be discovered and explored through methods that can be used to explore this type of structure. The process of manually creating an ontology is filled with costs, in which we can highlight, in particular, the time cost associated with the conception and implementation of an ontology which covers a large domain of knowledge. In light of this issue, the area of Ontology Learning aims to cover these issues, where methods from different areas of machine learning are integrated in the ontology construction process, with the aim of (semi)automating. Within the machine learning areas, the Natural Language Processing area can be highlighted, where a large set of techniques can be applied in order to identify and extract relevant terms/concepts, properties and relationships from a domain of knowledge, represented for example in the form of a text. Among the various techniques that can be applied, one such technique can be through the application of lexical-syntactic patterns, which aim to explore linguistic formalities with the goal of extracting hypernym and hyponym pairs so that the relationships, concepts can be identified. This approach has been applied to a set of classical culinary, agricultural, and medical texts from the XVI and XVII centuries, written in classical Portuguese. After having created the ontology, a system was developed so that the knowledge contained within it could be explored, giving particular attention to the different remedies, the ingredients contained within the remedies, and the preparation process of these ingredients. With this system, an easy and intuitive way to explore the knowledge present in the different medicines represented within the ontology was developed.Belo, OrlandoUniversidade do MinhoNunes, João Filipe da Costa20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/83038por203202414info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-09-16T01:16:30Zoai:repositorium.sdum.uminho.pt:1822/83038Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:44:41.637722Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
title Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
spellingShingle Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
Nunes, João Filipe da Costa
Ontologias
Ontology learning
Extração semiautomática
Machine learning
Natural language processing
Padrões léxico-sintáticos
Ontologies
Semi-automatic extraction
Lexical-syntactic patterns
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
title_full Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
title_fullStr Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
title_full_unstemmed Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
title_sort Elaboração semiautomática de uma ontologia para remédios a partir de textos antigos de medicina e de culinária
author Nunes, João Filipe da Costa
author_facet Nunes, João Filipe da Costa
author_role author
dc.contributor.none.fl_str_mv Belo, Orlando
Universidade do Minho
dc.contributor.author.fl_str_mv Nunes, João Filipe da Costa
dc.subject.por.fl_str_mv Ontologias
Ontology learning
Extração semiautomática
Machine learning
Natural language processing
Padrões léxico-sintáticos
Ontologies
Semi-automatic extraction
Lexical-syntactic patterns
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Ontologias
Ontology learning
Extração semiautomática
Machine learning
Natural language processing
Padrões léxico-sintáticos
Ontologies
Semi-automatic extraction
Lexical-syntactic patterns
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado integrado em Informatics Engineering
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/83038
url https://hdl.handle.net/1822/83038
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203202414
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133008559603712