ASAPP: alinhamento semântico automático de palavras aplicado ao português
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.26/47765 |
Resumo: | Apresentamos duas abordagens distintas `a tarefa de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia da outra. Uma primeira abordagem, apelidada de Reciclagem, baseia-se exclusivamente em heur´ısticas sobre redes semˆanticas para a l´ıngua portuguesa. A segunda abordagem, apelidada de ASAPP, baseia-se em aprendizagem autom´atica supervisionada. Acima de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de redes semˆanticas, atrav´es do seu desempenho nesta tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem ASAPP, juntamente com caracter´ısticas adicionais, ao n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de forma consistente. Isto ocorre tanto para o Portuguˆes Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para a inferˆencia textual, enquanto que a correla¸c˜ao dos valores atribu´ıdos para a similaridade semˆantica com aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021. |
id |
RCAP_e37922cde4ddf5e52fbdd1ef5e0ec914 |
---|---|
oai_identifier_str |
oai:comum.rcaap.pt:10400.26/47765 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
ASAPP: alinhamento semântico automático de palavras aplicado ao portuguêsASAPP : automatic semantic alignment for phrases applied to portuguesesimilaridade semânticainferência textualredes léxico-semânticasaprendizagem automáticasemantic similarityentailmentlexical semantic networksmachine learningApresentamos duas abordagens distintas `a tarefa de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia da outra. Uma primeira abordagem, apelidada de Reciclagem, baseia-se exclusivamente em heur´ısticas sobre redes semˆanticas para a l´ıngua portuguesa. A segunda abordagem, apelidada de ASAPP, baseia-se em aprendizagem autom´atica supervisionada. Acima de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de redes semˆanticas, atrav´es do seu desempenho nesta tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem ASAPP, juntamente com caracter´ısticas adicionais, ao n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de forma consistente. Isto ocorre tanto para o Portuguˆes Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para a inferˆencia textual, enquanto que a correla¸c˜ao dos valores atribu´ıdos para a similaridade semˆantica com aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021.Universidade do MinhoRepositório ComumAlves, Ana OliveiraRodrigues, Ricardo2023-11-02T15:31:25Z20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10400.26/47765porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T02:16:20Zoai:comum.rcaap.pt:10400.26/47765Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:09:57.909944Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
ASAPP: alinhamento semântico automático de palavras aplicado ao português ASAPP : automatic semantic alignment for phrases applied to portuguese |
title |
ASAPP: alinhamento semântico automático de palavras aplicado ao português |
spellingShingle |
ASAPP: alinhamento semântico automático de palavras aplicado ao português Alves, Ana Oliveira similaridade semântica inferência textual redes léxico-semânticas aprendizagem automática semantic similarity entailment lexical semantic networks machine learning |
title_short |
ASAPP: alinhamento semântico automático de palavras aplicado ao português |
title_full |
ASAPP: alinhamento semântico automático de palavras aplicado ao português |
title_fullStr |
ASAPP: alinhamento semântico automático de palavras aplicado ao português |
title_full_unstemmed |
ASAPP: alinhamento semântico automático de palavras aplicado ao português |
title_sort |
ASAPP: alinhamento semântico automático de palavras aplicado ao português |
author |
Alves, Ana Oliveira |
author_facet |
Alves, Ana Oliveira Rodrigues, Ricardo |
author_role |
author |
author2 |
Rodrigues, Ricardo |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Repositório Comum |
dc.contributor.author.fl_str_mv |
Alves, Ana Oliveira Rodrigues, Ricardo |
dc.subject.por.fl_str_mv |
similaridade semântica inferência textual redes léxico-semânticas aprendizagem automática semantic similarity entailment lexical semantic networks machine learning |
topic |
similaridade semântica inferência textual redes léxico-semânticas aprendizagem automática semantic similarity entailment lexical semantic networks machine learning |
description |
Apresentamos duas abordagens distintas `a tarefa de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia da outra. Uma primeira abordagem, apelidada de Reciclagem, baseia-se exclusivamente em heur´ısticas sobre redes semˆanticas para a l´ıngua portuguesa. A segunda abordagem, apelidada de ASAPP, baseia-se em aprendizagem autom´atica supervisionada. Acima de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de redes semˆanticas, atrav´es do seu desempenho nesta tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem ASAPP, juntamente com caracter´ısticas adicionais, ao n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de forma consistente. Isto ocorre tanto para o Portuguˆes Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para a inferˆencia textual, enquanto que a correla¸c˜ao dos valores atribu´ıdos para a similaridade semˆantica com aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 2016-01-01T00:00:00Z 2023-11-02T15:31:25Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.26/47765 |
url |
http://hdl.handle.net/10400.26/47765 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho |
publisher.none.fl_str_mv |
Universidade do Minho |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134654060560384 |