Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades

Detalhes bibliográficos
Autor(a) principal: Pinheiro, Isabelle
Data de Publicação: 2019
Outros Autores: Sens, Arthur Silva
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/202727
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.
id UFSC_9cb2f6cc59d3030a9720785015a970e5
oai_identifier_str oai:repositorio.ufsc.br:123456789/202727
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidadesContextoAnotação semânticaDesambiguaçãoAprendizado de máquina em grafosDados textuaisTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.Anotar semanticamente dados cuja semântica não é bem definidaou processável por máquinas, tais como grandes quantidades dedados semi ou não-estruturados atualmente disponíveis na Web,tem o potencial de alavancar aplicações que podem tirar proveitode interpretações automáticas de tais dados. Entretanto, os atuaisprocessos automáticos de anotação semântica falham em entregarresultados com boa qualidade. Uma maneira de melhorar a qualidadedos resultados gerados pelos processos de anotação atuais é considerarum contexto mais amplo no qual os dados se encontram. Contextossemânticos construídos a partir de algumas anotações confiáveispodem auxiliar no processo de desambiguação de novas anotações.Eles podem ser representados comoembeddings, que são uma categoriade modelos de processamento natural da linguagem que mapeiammatematicamente as palavras para vetores numéricos. Esse recursofacilita e agiliza a determinação de palavras (vetores) semelhantes ouclusters vetoriais. Este trabalho propõe algoritmos para a criação eutilização de contextos semânticos usando técnicas de aprendizado demáquina em grafos, para melhorar o processo de desambiguação denovas anotações. Os resultados das anotações produzidas pelo modeloproposto são comparadas com aqueles de ferramentas do estado daarte em anotação semântica de dados textuais.Semantically annotating data whose semantics are not well-definedby machines, such as large amounts of semi-structured unstructureddata currently available on the Web, has the potential to leverageapplications that can take advantage of automatic interpretations ofsuch data. However, the current automatic processes of semanticannotation fail to deliver results with good quality. One way toimprove the quality of the results generated by the current annotationprocesses is to consider a broader context in which the data are found.Semantic contexts constructed from reliable annotation can help in thedisambiguation process of new annotations. They can be representedas embedding, which is a category of natural language processingmodels that mathematically map the words to numerical vectors.This feature makes it much easier and streamlines the determinationof similar words (vectors) or vector clusters This work proposesalgorithms for the creation and use of semantic contexts using machinelearning techniques in graphs to improve the disambiguation processof new annotations. The results of the annotations produced by theproposed model are compared with those of state of the art tools insemantic annotation of textual data.Florianópolis, SCOliveira, Italo LopesFileto, RenatoUniversidade Federal de Santa CatarinaPinheiro, IsabelleSens, Arthur Silva2019-12-10T22:21:33Z2019-12-10T22:21:33Z2019-11-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis96application/pdfhttps://repositorio.ufsc.br/handle/123456789/202727info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2019-12-10T22:21:33Zoai:repositorio.ufsc.br:123456789/202727Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732019-12-10T22:21:33Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
title Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
spellingShingle Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
Pinheiro, Isabelle
Contexto
Anotação semântica
Desambiguação
Aprendizado de máquina em grafos
Dados textuais
title_short Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
title_full Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
title_fullStr Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
title_full_unstemmed Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
title_sort Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
author Pinheiro, Isabelle
author_facet Pinheiro, Isabelle
Sens, Arthur Silva
author_role author
author2 Sens, Arthur Silva
author2_role author
dc.contributor.none.fl_str_mv Oliveira, Italo Lopes
Fileto, Renato
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Pinheiro, Isabelle
Sens, Arthur Silva
dc.subject.por.fl_str_mv Contexto
Anotação semântica
Desambiguação
Aprendizado de máquina em grafos
Dados textuais
topic Contexto
Anotação semântica
Desambiguação
Aprendizado de máquina em grafos
Dados textuais
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-10T22:21:33Z
2019-12-10T22:21:33Z
2019-11-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/202727
url https://repositorio.ufsc.br/handle/123456789/202727
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 96
application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC
publisher.none.fl_str_mv Florianópolis, SC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652012634505216