Anotação de papéis semânticos para o português por Conditional Random Fields
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/8654 |
Resumo: | Semantic Role Labeling (SRL) can be described as a mean to achieve different purposes. Several subfields inside Natural Language Processing (NLP) benefit from semantic tags for their own goals. Reported in the literature over several centuries, the SRL task regained its popularity since 2000, when the first automatic annotated system was written. Large part of the literature is about SRL for the English language. Moreover, many papers evaluate each constituent of the sentence separately, and do not benefit from the sequential nature of words in which the task is included. The latest SRL works tend to decentralize the initial approach and reuse methodologies applied for the English language in their own languages, such as Spanish, Chinese, French, Swedish and Portuguese. Some methods were proposed for Portuguese, however, they failed to reach the level of quality obtained for the English language, and nonetheless, only one work was capable of annotating semantic roles from raw text. Thus, this work proposes an alternative system for semantically annotate portuguese text without embedded information, using a sequential model called Conditional Random Fields. |
id |
UFRJ_959c3be248d94b0a4ef6968ce0b2caea |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/8654 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Anotação de papéis semânticos para o português por Conditional Random FieldsProcessamento de linguagem naturalAprendizado computacionalCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOSemantic Role Labeling (SRL) can be described as a mean to achieve different purposes. Several subfields inside Natural Language Processing (NLP) benefit from semantic tags for their own goals. Reported in the literature over several centuries, the SRL task regained its popularity since 2000, when the first automatic annotated system was written. Large part of the literature is about SRL for the English language. Moreover, many papers evaluate each constituent of the sentence separately, and do not benefit from the sequential nature of words in which the task is included. The latest SRL works tend to decentralize the initial approach and reuse methodologies applied for the English language in their own languages, such as Spanish, Chinese, French, Swedish and Portuguese. Some methods were proposed for Portuguese, however, they failed to reach the level of quality obtained for the English language, and nonetheless, only one work was capable of annotating semantic roles from raw text. Thus, this work proposes an alternative system for semantically annotate portuguese text without embedded information, using a sequential model called Conditional Random Fields.A anotação de papéis semânticos (APS) pode ser descrita como um meio para diversos fins. Muitas são as áreas dentro do processamento de linguagem natural (PLN) que se beneficiam das etiquetas semânticas dos constituintes da sentença para enriquecer os dados em seus próprios objetivos. Relatado na literatura a diversos séculos, a tarefa de APS renova sua popularidade a partir dos anos 2000, quando o primeiro trabalho de anotação automática foi escrito. Principalmente analisadas para o inglês, muitos trabalhos avaliam cada constituinte da frase separadamente, e não se beneficiam da natureza sequencial de palavras em que a tarefa está incluída. Os últimos trabalho de APS tendem a descentralizar o enfoque inicial e reaproveitam metodologias utilizadas para a língua inglesa em suas próprias línguas, como o espanhol, chinês, francês, sueco e português. Alguns trabalhos já foram realizados para o português, porém, nenhum conseguiu atingir o nível de qualidade obtido para a língua inglesa, e não obstante, somente um trabalho capaz de anotar papéis semânticos a partir de textos puros foi encontrado. Desta forma, esta dissertação visa disponibilizar uma alternativa para anotar papéis semânticos em textos de português sem nenhuma informação agregada, utilizando o modelo de classificação sequencial, denominado Conditional Random Fields.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJXexéo, Geraldo Bonorinohttp://lattes.cnpq.br/6062983811271536Souza, Jano Moreira deLopes, Giseli RabelloGarrido, Luan Barbosa2019-07-04T13:47:19Z2023-12-21T03:01:02Z2017-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/8654porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:01:02Zoai:pantheon.ufrj.br:11422/8654Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:01:02Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
Anotação de papéis semânticos para o português por Conditional Random Fields |
title |
Anotação de papéis semânticos para o português por Conditional Random Fields |
spellingShingle |
Anotação de papéis semânticos para o português por Conditional Random Fields Garrido, Luan Barbosa Processamento de linguagem natural Aprendizado computacional CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
title_short |
Anotação de papéis semânticos para o português por Conditional Random Fields |
title_full |
Anotação de papéis semânticos para o português por Conditional Random Fields |
title_fullStr |
Anotação de papéis semânticos para o português por Conditional Random Fields |
title_full_unstemmed |
Anotação de papéis semânticos para o português por Conditional Random Fields |
title_sort |
Anotação de papéis semânticos para o português por Conditional Random Fields |
author |
Garrido, Luan Barbosa |
author_facet |
Garrido, Luan Barbosa |
author_role |
author |
dc.contributor.none.fl_str_mv |
Xexéo, Geraldo Bonorino http://lattes.cnpq.br/6062983811271536 Souza, Jano Moreira de Lopes, Giseli Rabello |
dc.contributor.author.fl_str_mv |
Garrido, Luan Barbosa |
dc.subject.por.fl_str_mv |
Processamento de linguagem natural Aprendizado computacional CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
topic |
Processamento de linguagem natural Aprendizado computacional CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
description |
Semantic Role Labeling (SRL) can be described as a mean to achieve different purposes. Several subfields inside Natural Language Processing (NLP) benefit from semantic tags for their own goals. Reported in the literature over several centuries, the SRL task regained its popularity since 2000, when the first automatic annotated system was written. Large part of the literature is about SRL for the English language. Moreover, many papers evaluate each constituent of the sentence separately, and do not benefit from the sequential nature of words in which the task is included. The latest SRL works tend to decentralize the initial approach and reuse methodologies applied for the English language in their own languages, such as Spanish, Chinese, French, Swedish and Portuguese. Some methods were proposed for Portuguese, however, they failed to reach the level of quality obtained for the English language, and nonetheless, only one work was capable of annotating semantic roles from raw text. Thus, this work proposes an alternative system for semantically annotate portuguese text without embedded information, using a sequential model called Conditional Random Fields. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-03 2019-07-04T13:47:19Z 2023-12-21T03:01:02Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/8654 |
url |
http://hdl.handle.net/11422/8654 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815455991730274304 |