ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES

Detalhes bibliográficos
Autor(a) principal: LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2
Resumo: A Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento.
id PUC_RIO-1_bbed18670a451d70b38c766e3d0fb6ce
oai_identifier_str oai:MAXWELL.puc-rio.br:30734
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES DEEP ARCHITECTURE FOR QUOTATION EXTRACTION 2017-03-08RUY LUIZ MILIDIU12249475091lattes.cnpq.br/6918010504362643MARCUS VINICIUS S P DE ARAGAOEDWARD HERMANN HAEUSLERRUY LUIZ MILIDIU10400375770lattes.cnpq.br/8691104750372805LUIS FELIPE MULLER DE OLIVEIRA HENRIQUESPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM INFORMÁTICAPUC-RioBRA Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento.Quotation Extraction and Attribution is the task of identifying quotations from a given text and associating them to their authors. In this work, we present a Quotation Extraction and Attribution system for the Portuguese language. The Quotation Extraction and Attribution task has been previously approached using various techniques and for a variety of languages and datasets. Traditional models to this task consist of extracting a rich set of hand-designed features and using them to feed a shallow classifier. In this work, unlike the traditional approach, we avoid using hand-designed features using unsupervised learning techniques and deep neural networks to automatically learn relevant features to solve the task. By avoiding design features by hand, our machine learning model became easily adaptable to other languages and domains. Our model is trained and evaluated at the GloboQuotes corpus, and its F1 performance metric is equal to 89.43 percent.https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2022-11-01T13:36:14Zoai:MAXWELL.puc-rio.br:30734Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342017-09-14T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.pt.fl_str_mv ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
dc.title.alternative.en.fl_str_mv DEEP ARCHITECTURE FOR QUOTATION EXTRACTION
title ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
spellingShingle ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES
title_short ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
title_full ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
title_fullStr ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
title_full_unstemmed ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
title_sort ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
author LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES
author_facet LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES
author_role author
dc.contributor.advisor1.fl_str_mv RUY LUIZ MILIDIU
dc.contributor.advisor1ID.fl_str_mv 12249475091
dc.contributor.advisor1Lattes.fl_str_mv lattes.cnpq.br/6918010504362643
dc.contributor.referee1.fl_str_mv MARCUS VINICIUS S P DE ARAGAO
dc.contributor.referee2.fl_str_mv EDWARD HERMANN HAEUSLER
dc.contributor.referee3.fl_str_mv RUY LUIZ MILIDIU
dc.contributor.authorID.fl_str_mv 10400375770
dc.contributor.authorLattes.fl_str_mv lattes.cnpq.br/8691104750372805
dc.contributor.author.fl_str_mv LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES
contributor_str_mv RUY LUIZ MILIDIU
MARCUS VINICIUS S P DE ARAGAO
EDWARD HERMANN HAEUSLER
RUY LUIZ MILIDIU
description A Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento.
publishDate 2017
dc.date.issued.fl_str_mv 2017-03-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.publisher.program.fl_str_mv PPG EM INFORMÁTICA
dc.publisher.initials.fl_str_mv PUC-Rio
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1748324932884889600