Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/561 |
Resumo: | This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation. |
id |
SCAR_14937a65fe5d2982b2a43af27a2450bc |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/561 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Pereira, Juliana WolfSantos, Marilde Terezinha Pradohttp://lattes.cnpq.br/9826026025118073http://lattes.cnpq.br/151238983936871845f41b37-13d4-47ce-be30-cabf726d50a72016-06-02T19:06:12Z2014-07-152016-06-02T19:06:12Z2014-07-01PEREIRA, Juliana Wolf. Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX. 2014. 99 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.https://repositorio.ufscar.br/handle/ufscar/561This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation.Esta dissertação apresenta uma abordagem de anotação semântica automática em documentos históricos do século XIX que discutem a constituição da língua pátria, a Língua Portuguesa no Brasil. O objetivo e gerar um conjunto de documentos semanticamente anotados em acordo com uma ontologia de domínio. Para prover essa ontologia de domínio, foi construída a Ontologia Instrumento Linguístico que apoiou o processo para a realização da anotação semântica automática. Os resultados obtidos com a anotação foram analisados em comparação com o Gold Standard e apresentaram alto grau de coincidência, entre 0.86 e 1.00 para a medida F1-Score. Além disso, foi possível localizar novos documentos sobre o domínio discutido em uma amostra das Revistas Brazileiras. Esses resultados comprovam a eficácia da abordagem de anotação semântica automática.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRProcessamento de textos (Computação)Extração de relações semânticasOntologiaDocumentos históricosMineração de textosProcessamento de linguagem natural (Computação)Semantic annotationOntology-based information extractionOntologyHistorical documentsText miningNatural language processingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIXinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-11bdb200e-99c1-45c7-8e62-ff292489211einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5898.pdfapplication/pdf11774674https://repositorio.ufscar.br/bitstream/ufscar/561/1/5898.pdf3cc87530008d9b42c105781f8a1068a3MD51TEXT5898.pdf.txt5898.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/561/2/5898.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5898.pdf.jpg5898.pdf.jpgIM Thumbnailimage/jpeg8852https://repositorio.ufscar.br/bitstream/ufscar/561/3/5898.pdf.jpgcf19cacc8a95df717d957034f76cd39cMD53ufscar/5612023-09-18 18:31:27.711oai:repositorio.ufscar.br:ufscar/561Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
title |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
spellingShingle |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX Pereira, Juliana Wolf Processamento de textos (Computação) Extração de relações semânticas Ontologia Documentos históricos Mineração de textos Processamento de linguagem natural (Computação) Semantic annotation Ontology-based information extraction Ontology Historical documents Text mining Natural language processing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
title_full |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
title_fullStr |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
title_full_unstemmed |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
title_sort |
Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX |
author |
Pereira, Juliana Wolf |
author_facet |
Pereira, Juliana Wolf |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/1512389839368718 |
dc.contributor.author.fl_str_mv |
Pereira, Juliana Wolf |
dc.contributor.advisor1.fl_str_mv |
Santos, Marilde Terezinha Prado |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9826026025118073 |
dc.contributor.authorID.fl_str_mv |
45f41b37-13d4-47ce-be30-cabf726d50a7 |
contributor_str_mv |
Santos, Marilde Terezinha Prado |
dc.subject.por.fl_str_mv |
Processamento de textos (Computação) Extração de relações semânticas Ontologia Documentos históricos Mineração de textos Processamento de linguagem natural (Computação) |
topic |
Processamento de textos (Computação) Extração de relações semânticas Ontologia Documentos históricos Mineração de textos Processamento de linguagem natural (Computação) Semantic annotation Ontology-based information extraction Ontology Historical documents Text mining Natural language processing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Semantic annotation Ontology-based information extraction Ontology Historical documents Text mining Natural language processing |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation. |
publishDate |
2014 |
dc.date.available.fl_str_mv |
2014-07-15 2016-06-02T19:06:12Z |
dc.date.issued.fl_str_mv |
2014-07-01 |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:06:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PEREIRA, Juliana Wolf. Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX. 2014. 99 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/561 |
identifier_str_mv |
PEREIRA, Juliana Wolf. Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX. 2014. 99 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014. |
url |
https://repositorio.ufscar.br/handle/ufscar/561 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
1bdb200e-99c1-45c7-8e62-ff292489211e |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/561/1/5898.pdf https://repositorio.ufscar.br/bitstream/ufscar/561/2/5898.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/561/3/5898.pdf.jpg |
bitstream.checksum.fl_str_mv |
3cc87530008d9b42c105781f8a1068a3 d41d8cd98f00b204e9800998ecf8427e cf19cacc8a95df717d957034f76cd39c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136245631975424 |