Avaliação de recursos computacionais para o português

Detalhes bibliográficos
Autor(a) principal: Gonçalves, Matilde
Data de Publicação: 2021
Outros Autores: Coheur, Luisa, Baptista, Jorge, Mineiro, Ana
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.1/14997
Resumo: Têm sido desenvolvidas várias ferramentas para o processamento da língua portuguesa. No entanto, devido a escolhas variadas na base dos comportamentos destas ferramentas (diferentes opções de pré-processamento, diferentes conjuntos de etiquetas morfossintáticas e de dependências, etc.), torna-se difícil ter uma ideia do desempenho comparativo de cada uma. Neste trabalho, avaliamos um conjunto de ferramentas gratuitas e publicamente disponíveis, que realizam as tarefas de Etiquetação Morfossintática e de Reconhecimento de Entidades Mencionadas, para a língua portuguesa. São tidos em conta doze modelos diferentes para a primeira tarefa e oito para a segunda. Todos os recursos usados nesta avaliaçãao (tabelas de mapeamento de etiquetas, corpora de referência, etc.) são disponibilizados, permitindo replicar/ afinar os resultados. Apresentamos ainda um estudo qualitativo de dois analisadores de dependências. Não temos conhecimento de nenhum trabalho similar recente, isto ´e, que tenha em conta as ferramentas atuais disponíveis, realizado para a língua portuguesa.
id RCAP_c5f274cb19f318aeccaecaab92e1142f
oai_identifier_str oai:sapientia.ualg.pt:10400.1/14997
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Avaliação de recursos computacionais para o portuguêsProcessamento da linguagem naturalReconhecimento de entidades mencionadasAvaliação de recursosAnálise de dependênciasLíngua portuguesaAnálise morfosintáticaTêm sido desenvolvidas várias ferramentas para o processamento da língua portuguesa. No entanto, devido a escolhas variadas na base dos comportamentos destas ferramentas (diferentes opções de pré-processamento, diferentes conjuntos de etiquetas morfossintáticas e de dependências, etc.), torna-se difícil ter uma ideia do desempenho comparativo de cada uma. Neste trabalho, avaliamos um conjunto de ferramentas gratuitas e publicamente disponíveis, que realizam as tarefas de Etiquetação Morfossintática e de Reconhecimento de Entidades Mencionadas, para a língua portuguesa. São tidos em conta doze modelos diferentes para a primeira tarefa e oito para a segunda. Todos os recursos usados nesta avaliaçãao (tabelas de mapeamento de etiquetas, corpora de referência, etc.) são disponibilizados, permitindo replicar/ afinar os resultados. Apresentamos ainda um estudo qualitativo de dois analisadores de dependências. Não temos conhecimento de nenhum trabalho similar recente, isto ´e, que tenha em conta as ferramentas atuais disponíveis, realizado para a língua portuguesa.Universidade do MinhoSapientiaGonçalves, MatildeCoheur, LuisaBaptista, JorgeMineiro, Ana2021-01-29T09:13:36Z20212021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10400.1/14997por1647-081810.21814/lm.12.2.331info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-06T02:02:32Zoai:sapientia.ualg.pt:10400.1/14997Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:05:55.506545Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Avaliação de recursos computacionais para o português
title Avaliação de recursos computacionais para o português
spellingShingle Avaliação de recursos computacionais para o português
Gonçalves, Matilde
Processamento da linguagem natural
Reconhecimento de entidades mencionadas
Avaliação de recursos
Análise de dependências
Língua portuguesa
Análise morfosintática
title_short Avaliação de recursos computacionais para o português
title_full Avaliação de recursos computacionais para o português
title_fullStr Avaliação de recursos computacionais para o português
title_full_unstemmed Avaliação de recursos computacionais para o português
title_sort Avaliação de recursos computacionais para o português
author Gonçalves, Matilde
author_facet Gonçalves, Matilde
Coheur, Luisa
Baptista, Jorge
Mineiro, Ana
author_role author
author2 Coheur, Luisa
Baptista, Jorge
Mineiro, Ana
author2_role author
author
author
dc.contributor.none.fl_str_mv Sapientia
dc.contributor.author.fl_str_mv Gonçalves, Matilde
Coheur, Luisa
Baptista, Jorge
Mineiro, Ana
dc.subject.por.fl_str_mv Processamento da linguagem natural
Reconhecimento de entidades mencionadas
Avaliação de recursos
Análise de dependências
Língua portuguesa
Análise morfosintática
topic Processamento da linguagem natural
Reconhecimento de entidades mencionadas
Avaliação de recursos
Análise de dependências
Língua portuguesa
Análise morfosintática
description Têm sido desenvolvidas várias ferramentas para o processamento da língua portuguesa. No entanto, devido a escolhas variadas na base dos comportamentos destas ferramentas (diferentes opções de pré-processamento, diferentes conjuntos de etiquetas morfossintáticas e de dependências, etc.), torna-se difícil ter uma ideia do desempenho comparativo de cada uma. Neste trabalho, avaliamos um conjunto de ferramentas gratuitas e publicamente disponíveis, que realizam as tarefas de Etiquetação Morfossintática e de Reconhecimento de Entidades Mencionadas, para a língua portuguesa. São tidos em conta doze modelos diferentes para a primeira tarefa e oito para a segunda. Todos os recursos usados nesta avaliaçãao (tabelas de mapeamento de etiquetas, corpora de referência, etc.) são disponibilizados, permitindo replicar/ afinar os resultados. Apresentamos ainda um estudo qualitativo de dois analisadores de dependências. Não temos conhecimento de nenhum trabalho similar recente, isto ´e, que tenha em conta as ferramentas atuais disponíveis, realizado para a língua portuguesa.
publishDate 2021
dc.date.none.fl_str_mv 2021-01-29T09:13:36Z
2021
2021-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.1/14997
url http://hdl.handle.net/10400.1/14997
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 1647-0818
10.21814/lm.12.2.331
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho
publisher.none.fl_str_mv Universidade do Minho
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133299722944512