ASAPP: alinhamento semântico automático de palavras aplicado ao português

Detalhes bibliográficos
Autor(a) principal: Alves, Ana Oliveira
Data de Publicação: 2016
Outros Autores: Rodrigues, Ricardo
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.26/47765
Resumo: Apresentamos duas abordagens distintas `a tarefa de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia da outra. Uma primeira abordagem, apelidada de Reciclagem, baseia-se exclusivamente em heur´ısticas sobre redes semˆanticas para a l´ıngua portuguesa. A segunda abordagem, apelidada de ASAPP, baseia-se em aprendizagem autom´atica supervisionada. Acima de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de redes semˆanticas, atrav´es do seu desempenho nesta tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem ASAPP, juntamente com caracter´ısticas adicionais, ao n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de forma consistente. Isto ocorre tanto para o Portuguˆes Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para a inferˆencia textual, enquanto que a correla¸c˜ao dos valores atribu´ıdos para a similaridade semˆantica com aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021.
id RCAP_e37922cde4ddf5e52fbdd1ef5e0ec914
oai_identifier_str oai:comum.rcaap.pt:10400.26/47765
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling ASAPP: alinhamento semântico automático de palavras aplicado ao portuguêsASAPP : automatic semantic alignment for phrases applied to portuguesesimilaridade semânticainferência textualredes léxico-semânticasaprendizagem automáticasemantic similarityentailmentlexical semantic networksmachine learningApresentamos duas abordagens distintas `a tarefa de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia da outra. Uma primeira abordagem, apelidada de Reciclagem, baseia-se exclusivamente em heur´ısticas sobre redes semˆanticas para a l´ıngua portuguesa. A segunda abordagem, apelidada de ASAPP, baseia-se em aprendizagem autom´atica supervisionada. Acima de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de redes semˆanticas, atrav´es do seu desempenho nesta tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem ASAPP, juntamente com caracter´ısticas adicionais, ao n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de forma consistente. Isto ocorre tanto para o Portuguˆes Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para a inferˆencia textual, enquanto que a correla¸c˜ao dos valores atribu´ıdos para a similaridade semˆantica com aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021.Universidade do MinhoRepositório ComumAlves, Ana OliveiraRodrigues, Ricardo2023-11-02T15:31:25Z20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10400.26/47765porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T02:16:20Zoai:comum.rcaap.pt:10400.26/47765Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:09:57.909944Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv ASAPP: alinhamento semântico automático de palavras aplicado ao português
ASAPP : automatic semantic alignment for phrases applied to portuguese
title ASAPP: alinhamento semântico automático de palavras aplicado ao português
spellingShingle ASAPP: alinhamento semântico automático de palavras aplicado ao português
Alves, Ana Oliveira
similaridade semântica
inferência textual
redes léxico-semânticas
aprendizagem automática
semantic similarity
entailment
lexical semantic networks
machine learning
title_short ASAPP: alinhamento semântico automático de palavras aplicado ao português
title_full ASAPP: alinhamento semântico automático de palavras aplicado ao português
title_fullStr ASAPP: alinhamento semântico automático de palavras aplicado ao português
title_full_unstemmed ASAPP: alinhamento semântico automático de palavras aplicado ao português
title_sort ASAPP: alinhamento semântico automático de palavras aplicado ao português
author Alves, Ana Oliveira
author_facet Alves, Ana Oliveira
Rodrigues, Ricardo
author_role author
author2 Rodrigues, Ricardo
author2_role author
dc.contributor.none.fl_str_mv Repositório Comum
dc.contributor.author.fl_str_mv Alves, Ana Oliveira
Rodrigues, Ricardo
dc.subject.por.fl_str_mv similaridade semântica
inferência textual
redes léxico-semânticas
aprendizagem automática
semantic similarity
entailment
lexical semantic networks
machine learning
topic similaridade semântica
inferência textual
redes léxico-semânticas
aprendizagem automática
semantic similarity
entailment
lexical semantic networks
machine learning
description Apresentamos duas abordagens distintas `a tarefa de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia da outra. Uma primeira abordagem, apelidada de Reciclagem, baseia-se exclusivamente em heur´ısticas sobre redes semˆanticas para a l´ıngua portuguesa. A segunda abordagem, apelidada de ASAPP, baseia-se em aprendizagem autom´atica supervisionada. Acima de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de redes semˆanticas, atrav´es do seu desempenho nesta tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem ASAPP, juntamente com caracter´ısticas adicionais, ao n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de forma consistente. Isto ocorre tanto para o Portuguˆes Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para a inferˆencia textual, enquanto que a correla¸c˜ao dos valores atribu´ıdos para a similaridade semˆantica com aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021.
publishDate 2016
dc.date.none.fl_str_mv 2016
2016-01-01T00:00:00Z
2023-11-02T15:31:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.26/47765
url http://hdl.handle.net/10400.26/47765
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho
publisher.none.fl_str_mv Universidade do Minho
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134654060560384