ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Institucional da PUC-RIO (Projeto Maxwell) |
Texto Completo: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2 |
Resumo: | A Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento. |
id |
PUC_RIO-1_bbed18670a451d70b38c766e3d0fb6ce |
---|---|
oai_identifier_str |
oai:MAXWELL.puc-rio.br:30734 |
network_acronym_str |
PUC_RIO-1 |
network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository_id_str |
534 |
spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES DEEP ARCHITECTURE FOR QUOTATION EXTRACTION 2017-03-08RUY LUIZ MILIDIU12249475091lattes.cnpq.br/6918010504362643MARCUS VINICIUS S P DE ARAGAOEDWARD HERMANN HAEUSLERRUY LUIZ MILIDIU10400375770lattes.cnpq.br/8691104750372805LUIS FELIPE MULLER DE OLIVEIRA HENRIQUESPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM INFORMÁTICAPUC-RioBRA Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento.Quotation Extraction and Attribution is the task of identifying quotations from a given text and associating them to their authors. In this work, we present a Quotation Extraction and Attribution system for the Portuguese language. The Quotation Extraction and Attribution task has been previously approached using various techniques and for a variety of languages and datasets. Traditional models to this task consist of extracting a rich set of hand-designed features and using them to feed a shallow classifier. In this work, unlike the traditional approach, we avoid using hand-designed features using unsupervised learning techniques and deep neural networks to automatically learn relevant features to solve the task. By avoiding design features by hand, our machine learning model became easily adaptable to other languages and domains. Our model is trained and evaluated at the GloboQuotes corpus, and its F1 performance metric is equal to 89.43 percent.https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2022-11-01T13:36:14Zoai:MAXWELL.puc-rio.br:30734Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342017-09-14T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
dc.title.pt.fl_str_mv |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
dc.title.alternative.en.fl_str_mv |
DEEP ARCHITECTURE FOR QUOTATION EXTRACTION |
title |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
spellingShingle |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES |
title_short |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
title_full |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
title_fullStr |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
title_full_unstemmed |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
title_sort |
ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES |
author |
LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES |
author_facet |
LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
RUY LUIZ MILIDIU |
dc.contributor.advisor1ID.fl_str_mv |
12249475091 |
dc.contributor.advisor1Lattes.fl_str_mv |
lattes.cnpq.br/6918010504362643 |
dc.contributor.referee1.fl_str_mv |
MARCUS VINICIUS S P DE ARAGAO |
dc.contributor.referee2.fl_str_mv |
EDWARD HERMANN HAEUSLER |
dc.contributor.referee3.fl_str_mv |
RUY LUIZ MILIDIU |
dc.contributor.authorID.fl_str_mv |
10400375770 |
dc.contributor.authorLattes.fl_str_mv |
lattes.cnpq.br/8691104750372805 |
dc.contributor.author.fl_str_mv |
LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES |
contributor_str_mv |
RUY LUIZ MILIDIU MARCUS VINICIUS S P DE ARAGAO EDWARD HERMANN HAEUSLER RUY LUIZ MILIDIU |
description |
A Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-03-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2 |
url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO |
dc.publisher.program.fl_str_mv |
PPG EM INFORMÁTICA |
dc.publisher.initials.fl_str_mv |
PUC-Rio |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
instacron_str |
PUC_RIO |
institution |
PUC_RIO |
reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
repository.mail.fl_str_mv |
|
_version_ |
1748324932884889600 |