Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Outros Autores: | |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/202727 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação. |
id |
UFSC_9cb2f6cc59d3030a9720785015a970e5 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/202727 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidadesContextoAnotação semânticaDesambiguaçãoAprendizado de máquina em grafosDados textuaisTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.Anotar semanticamente dados cuja semântica não é bem definidaou processável por máquinas, tais como grandes quantidades dedados semi ou não-estruturados atualmente disponíveis na Web,tem o potencial de alavancar aplicações que podem tirar proveitode interpretações automáticas de tais dados. Entretanto, os atuaisprocessos automáticos de anotação semântica falham em entregarresultados com boa qualidade. Uma maneira de melhorar a qualidadedos resultados gerados pelos processos de anotação atuais é considerarum contexto mais amplo no qual os dados se encontram. Contextossemânticos construídos a partir de algumas anotações confiáveispodem auxiliar no processo de desambiguação de novas anotações.Eles podem ser representados comoembeddings, que são uma categoriade modelos de processamento natural da linguagem que mapeiammatematicamente as palavras para vetores numéricos. Esse recursofacilita e agiliza a determinação de palavras (vetores) semelhantes ouclusters vetoriais. Este trabalho propõe algoritmos para a criação eutilização de contextos semânticos usando técnicas de aprendizado demáquina em grafos, para melhorar o processo de desambiguação denovas anotações. Os resultados das anotações produzidas pelo modeloproposto são comparadas com aqueles de ferramentas do estado daarte em anotação semântica de dados textuais.Semantically annotating data whose semantics are not well-definedby machines, such as large amounts of semi-structured unstructureddata currently available on the Web, has the potential to leverageapplications that can take advantage of automatic interpretations ofsuch data. However, the current automatic processes of semanticannotation fail to deliver results with good quality. One way toimprove the quality of the results generated by the current annotationprocesses is to consider a broader context in which the data are found.Semantic contexts constructed from reliable annotation can help in thedisambiguation process of new annotations. They can be representedas embedding, which is a category of natural language processingmodels that mathematically map the words to numerical vectors.This feature makes it much easier and streamlines the determinationof similar words (vectors) or vector clusters This work proposesalgorithms for the creation and use of semantic contexts using machinelearning techniques in graphs to improve the disambiguation processof new annotations. The results of the annotations produced by theproposed model are compared with those of state of the art tools insemantic annotation of textual data.Florianópolis, SCOliveira, Italo LopesFileto, RenatoUniversidade Federal de Santa CatarinaPinheiro, IsabelleSens, Arthur Silva2019-12-10T22:21:33Z2019-12-10T22:21:33Z2019-11-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis96application/pdfhttps://repositorio.ufsc.br/handle/123456789/202727info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2019-12-10T22:21:33Zoai:repositorio.ufsc.br:123456789/202727Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732019-12-10T22:21:33Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
title |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
spellingShingle |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades Pinheiro, Isabelle Contexto Anotação semântica Desambiguação Aprendizado de máquina em grafos Dados textuais |
title_short |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
title_full |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
title_fullStr |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
title_full_unstemmed |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
title_sort |
Uso de classificadores binários em embeddings de palavras e conhecimento na tarefa de ligação de entidades |
author |
Pinheiro, Isabelle |
author_facet |
Pinheiro, Isabelle Sens, Arthur Silva |
author_role |
author |
author2 |
Sens, Arthur Silva |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Oliveira, Italo Lopes Fileto, Renato Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Pinheiro, Isabelle Sens, Arthur Silva |
dc.subject.por.fl_str_mv |
Contexto Anotação semântica Desambiguação Aprendizado de máquina em grafos Dados textuais |
topic |
Contexto Anotação semântica Desambiguação Aprendizado de máquina em grafos Dados textuais |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-12-10T22:21:33Z 2019-12-10T22:21:33Z 2019-11-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/202727 |
url |
https://repositorio.ufsc.br/handle/123456789/202727 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
96 application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC |
publisher.none.fl_str_mv |
Florianópolis, SC |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652012634505216 |