Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Weber, Cristofer

Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Detalhes bibliográficos
Autor(a) principal:	Weber, Cristofer
Data de Publicação:	2015
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo:	http://tede2.pucrs.br/tede2/handle/tede/6434
Resumo:	Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.

Metadados do item

id	P_RS_d038a5bacd790cea8947565e494f2be0
oai_identifier_str	oai:tede2.pucrs.br:tede/6434
network_acronym_str	P_RS
network_name_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling	Vieira, Renata451.334.330-34959.843.560-15Weber, Cristofer2015-12-14T19:55:11Z2015-03-16http://tede2.pucrs.br/tede2/handle/tede/6434Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.Submitted by Setor de Tratamento da Informação - BC/PUCRS (tede2@pucrs.br) on 2015-12-14T19:55:10Z No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5)Made available in DSpace on 2015-12-14T19:55:11Z (GMT). No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015-03-16application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/163833/476712%20-%20Texto%20Completo.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilFaculdade de InformáticaINFORMÁTICAPROCESSAMENTO DA LINGUAGEM NATURALLINGUÍSTICA COMPUTACIONALCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOConstrução de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpediainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis1974996533081274470600600600-30085425104011491443671711205811204509info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL476712 - Texto Completo.pdf.jpg476712 - Texto Completo.pdf.jpgimage/jpeg3892http://tede2.pucrs.br/tede2/bitstream/tede/6434/4/476712+-+Texto+Completo.pdf.jpgf31a0a67a1d0603c521aa2fe1cc32ef7MD54TEXT476712 - Texto Completo.pdf.txt476712 - Texto Completo.pdf.txttext/plain139726http://tede2.pucrs.br/tede2/bitstream/tede/6434/3/476712+-+Texto+Completo.pdf.txt7500ed933efcd0f1ad59c5337056c702MD53ORIGINAL476712 - Texto Completo.pdf476712 - Texto Completo.pdfapplication/pdf1416751http://tede2.pucrs.br/tede2/bitstream/tede/6434/2/476712+-+Texto+Completo.pdf0b603e0667dd53303efd13181a62d31eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/6434/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/64342015-12-14 20:00:34.272oai:tede2.pucrs.br:tede/6434QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br\|\|opendoar:2015-12-14T22:00:34Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
spellingShingle	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia Weber, Cristofer INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_fullStr	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full_unstemmed	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_sort	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
author	Weber, Cristofer
author_facet	Weber, Cristofer
author_role	author
dc.contributor.advisor1.fl_str_mv	Vieira, Renata
dc.contributor.advisor1ID.fl_str_mv	451.334.330-34
dc.contributor.authorID.fl_str_mv	959.843.560-15
dc.contributor.author.fl_str_mv	Weber, Cristofer
contributor_str_mv	Vieira, Renata
dc.subject.por.fl_str_mv	INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL
topic	INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description	Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.
publishDate	2015
dc.date.accessioned.fl_str_mv	2015-12-14T19:55:11Z
dc.date.issued.fl_str_mv	2015-03-16
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://tede2.pucrs.br/tede2/handle/tede/6434
url	http://tede2.pucrs.br/tede2/handle/tede/6434
dc.language.iso.fl_str_mv	por
language	por
dc.relation.program.fl_str_mv	1974996533081274470
dc.relation.confidence.fl_str_mv	600 600 600
dc.relation.department.fl_str_mv	-3008542510401149144
dc.relation.cnpq.fl_str_mv	3671711205811204509
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv	Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv	PUCRS
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Faculdade de Informática
publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS
instname_str	Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str	PUC_RS
institution	PUC_RS
reponame_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
collection	Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv	http://tede2.pucrs.br/tede2/bitstream/tede/6434/4/476712+-+Texto+Completo.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/6434/3/476712+-+Texto+Completo.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/6434/2/476712+-+Texto+Completo.pdf http://tede2.pucrs.br/tede2/bitstream/tede/6434/1/license.txt
bitstream.checksum.fl_str_mv	f31a0a67a1d0603c521aa2fe1cc32ef7 7500ed933efcd0f1ad59c5337056c702 0b603e0667dd53303efd13181a62d31e 5a9d6006225b368ef605ba16b4f6d1be
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv	biblioteca.central@pucrs.br\|\|
_version_	1799765316300963840

Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Registros relacionados