Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/6434 |
Resumo: | Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. |
id |
P_RS_d038a5bacd790cea8947565e494f2be0 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/6434 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Vieira, Renata451.334.330-34959.843.560-15Weber, Cristofer2015-12-14T19:55:11Z2015-03-16http://tede2.pucrs.br/tede2/handle/tede/6434Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.Submitted by Setor de Tratamento da Informação - BC/PUCRS (tede2@pucrs.br) on 2015-12-14T19:55:10Z No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5)Made available in DSpace on 2015-12-14T19:55:11Z (GMT). No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015-03-16application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/163833/476712%20-%20Texto%20Completo.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilFaculdade de InformáticaINFORMÁTICAPROCESSAMENTO DA LINGUAGEM NATURALLINGUÍSTICA COMPUTACIONALCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOConstrução de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpediainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis1974996533081274470600600600-30085425104011491443671711205811204509info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL476712 - Texto Completo.pdf.jpg476712 - Texto Completo.pdf.jpgimage/jpeg3892http://tede2.pucrs.br/tede2/bitstream/tede/6434/4/476712+-+Texto+Completo.pdf.jpgf31a0a67a1d0603c521aa2fe1cc32ef7MD54TEXT476712 - Texto Completo.pdf.txt476712 - Texto Completo.pdf.txttext/plain139726http://tede2.pucrs.br/tede2/bitstream/tede/6434/3/476712+-+Texto+Completo.pdf.txt7500ed933efcd0f1ad59c5337056c702MD53ORIGINAL476712 - Texto Completo.pdf476712 - Texto Completo.pdfapplication/pdf1416751http://tede2.pucrs.br/tede2/bitstream/tede/6434/2/476712+-+Texto+Completo.pdf0b603e0667dd53303efd13181a62d31eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/6434/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/64342015-12-14 20:00:34.272oai:tede2.pucrs.br:tede/6434QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-12-14T22:00:34Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
title |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
spellingShingle |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia Weber, Cristofer INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
title_full |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
title_fullStr |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
title_full_unstemmed |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
title_sort |
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
author |
Weber, Cristofer |
author_facet |
Weber, Cristofer |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Vieira, Renata |
dc.contributor.advisor1ID.fl_str_mv |
451.334.330-34 |
dc.contributor.authorID.fl_str_mv |
959.843.560-15 |
dc.contributor.author.fl_str_mv |
Weber, Cristofer |
contributor_str_mv |
Vieira, Renata |
dc.subject.por.fl_str_mv |
INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL |
topic |
INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. |
publishDate |
2015 |
dc.date.accessioned.fl_str_mv |
2015-12-14T19:55:11Z |
dc.date.issued.fl_str_mv |
2015-03-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/6434 |
url |
http://tede2.pucrs.br/tede2/handle/tede/6434 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
600 600 600 |
dc.relation.department.fl_str_mv |
-3008542510401149144 |
dc.relation.cnpq.fl_str_mv |
3671711205811204509 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Faculdade de Informática |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/6434/4/476712+-+Texto+Completo.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/6434/3/476712+-+Texto+Completo.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/6434/2/476712+-+Texto+Completo.pdf http://tede2.pucrs.br/tede2/bitstream/tede/6434/1/license.txt |
bitstream.checksum.fl_str_mv |
f31a0a67a1d0603c521aa2fe1cc32ef7 7500ed933efcd0f1ad59c5337056c702 0b603e0667dd53303efd13181a62d31e 5a9d6006225b368ef605ba16b4f6d1be |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765316300963840 |