Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX

Detalhes bibliográficos
Autor(a) principal: Pereira, Juliana Wolf
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/561
Resumo: This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation.
id SCAR_14937a65fe5d2982b2a43af27a2450bc
oai_identifier_str oai:repositorio.ufscar.br:ufscar/561
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Pereira, Juliana WolfSantos, Marilde Terezinha Pradohttp://lattes.cnpq.br/9826026025118073http://lattes.cnpq.br/151238983936871845f41b37-13d4-47ce-be30-cabf726d50a72016-06-02T19:06:12Z2014-07-152016-06-02T19:06:12Z2014-07-01PEREIRA, Juliana Wolf. Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX. 2014. 99 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.https://repositorio.ufscar.br/handle/ufscar/561This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation.Esta dissertação apresenta uma abordagem de anotação semântica automática em documentos históricos do século XIX que discutem a constituição da língua pátria, a Língua Portuguesa no Brasil. O objetivo e gerar um conjunto de documentos semanticamente anotados em acordo com uma ontologia de domínio. Para prover essa ontologia de domínio, foi construída a Ontologia Instrumento Linguístico que apoiou o processo para a realização da anotação semântica automática. Os resultados obtidos com a anotação foram analisados em comparação com o Gold Standard e apresentaram alto grau de coincidência, entre 0.86 e 1.00 para a medida F1-Score. Além disso, foi possível localizar novos documentos sobre o domínio discutido em uma amostra das Revistas Brazileiras. Esses resultados comprovam a eficácia da abordagem de anotação semântica automática.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRProcessamento de textos (Computação)Extração de relações semânticasOntologiaDocumentos históricosMineração de textosProcessamento de linguagem natural (Computação)Semantic annotationOntology-based information extractionOntologyHistorical documentsText miningNatural language processingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIXinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-11bdb200e-99c1-45c7-8e62-ff292489211einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5898.pdfapplication/pdf11774674https://repositorio.ufscar.br/bitstream/ufscar/561/1/5898.pdf3cc87530008d9b42c105781f8a1068a3MD51TEXT5898.pdf.txt5898.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/561/2/5898.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5898.pdf.jpg5898.pdf.jpgIM Thumbnailimage/jpeg8852https://repositorio.ufscar.br/bitstream/ufscar/561/3/5898.pdf.jpgcf19cacc8a95df717d957034f76cd39cMD53ufscar/5612023-09-18 18:31:27.711oai:repositorio.ufscar.br:ufscar/561Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
title Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
spellingShingle Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
Pereira, Juliana Wolf
Processamento de textos (Computação)
Extração de relações semânticas
Ontologia
Documentos históricos
Mineração de textos
Processamento de linguagem natural (Computação)
Semantic annotation
Ontology-based information extraction
Ontology
Historical documents
Text mining
Natural language processing
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
title_full Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
title_fullStr Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
title_full_unstemmed Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
title_sort Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
author Pereira, Juliana Wolf
author_facet Pereira, Juliana Wolf
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/1512389839368718
dc.contributor.author.fl_str_mv Pereira, Juliana Wolf
dc.contributor.advisor1.fl_str_mv Santos, Marilde Terezinha Prado
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9826026025118073
dc.contributor.authorID.fl_str_mv 45f41b37-13d4-47ce-be30-cabf726d50a7
contributor_str_mv Santos, Marilde Terezinha Prado
dc.subject.por.fl_str_mv Processamento de textos (Computação)
Extração de relações semânticas
Ontologia
Documentos históricos
Mineração de textos
Processamento de linguagem natural (Computação)
topic Processamento de textos (Computação)
Extração de relações semânticas
Ontologia
Documentos históricos
Mineração de textos
Processamento de linguagem natural (Computação)
Semantic annotation
Ontology-based information extraction
Ontology
Historical documents
Text mining
Natural language processing
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Semantic annotation
Ontology-based information extraction
Ontology
Historical documents
Text mining
Natural language processing
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation.
publishDate 2014
dc.date.available.fl_str_mv 2014-07-15
2016-06-02T19:06:12Z
dc.date.issued.fl_str_mv 2014-07-01
dc.date.accessioned.fl_str_mv 2016-06-02T19:06:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PEREIRA, Juliana Wolf. Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX. 2014. 99 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/561
identifier_str_mv PEREIRA, Juliana Wolf. Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX. 2014. 99 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.
url https://repositorio.ufscar.br/handle/ufscar/561
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 1bdb200e-99c1-45c7-8e62-ff292489211e
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/561/1/5898.pdf
https://repositorio.ufscar.br/bitstream/ufscar/561/2/5898.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/561/3/5898.pdf.jpg
bitstream.checksum.fl_str_mv 3cc87530008d9b42c105781f8a1068a3
d41d8cd98f00b204e9800998ecf8427e
cf19cacc8a95df717d957034f76cd39c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136245631975424