Anotação semântica (semi)automática de corpora: a frase nominal em alemão

Detalhes bibliográficos
Autor(a) principal: Arias Arias, Iván
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/79649
Resumo: Dissertação de mestrado Europeu em Lexicografia
id RCAP_99f72e4c0a267d187155e8ed4610ed5a
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/79649
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Anotação semântica (semi)automática de corpora: a frase nominal em alemão(Semi)automatische semantische annotation von korpora: die nominalphrase im deutschenAnotação semânticaCorporaPacote lexicalPLNValência nominalSemantische annotationKorporaLexikalisches paketNLPNominale valenzHumanidades::Línguas e LiteraturasDissertação de mestrado Europeu em LexicografiaNos dias de hoje, no âmbito da investigação e da prática lexicográfica, a utilização de corpora tem-se revelado muito recorrente, principalmente pelo facto de ser considerada como a metodologia mais fiável para alcançarmos exemplos representativos das línguas naturais. Embora as ferramentas de Processamento de Língua Natural (PLN) tenham conseguido grandes avanços na anotação morfossintática de textos, continua a faltar uma anotação semântica exaustiva e sistematizada. Esta carência evidencia-se principalmente quando se fala em lexicografia e gramática de valências, pois na bibliografia teórica (cf. Domínguez, 2011) aponta-se para o facto de a valência semântica ser fulcral para a delimitação de argumentos que acompanham um lexema considerado como portador de valência. Daí surge, no contexto desta investigação, a necessidade de uma aproximação à anotação semântica de corpora, em que se preste atenção especial aos argumentos no nível da frase nominal e ao seu comportamento semântico, para além da etiquetagem morfossintática com a qual contamos normalmente. A gramática e lexicografia de valências, assim como a semântica léxica, constituem, portanto, o ponto de partida teórico da presente dissertação de mestrado. No que diz respeito à metodologia, o presente trabalho cingir-se-á à análise das estruturas argumentais de três nomes do campo semântico da comunicação em alemão (Bericht, Diskussion e Frage) e, através de metodologia de PLN, desenhar-se-á um API script que possibilite o cruzamento de dados de corpora com alguns pacotes lexicais delimitados e criados no âmbito dos projetos PORTLEX, MultiGenera e MultiComb. Esta metodologia permitir-nos-á analisar, a posteriori, a fiabilidade do script desenvolvido, e conduzirá para a extração de conclusões relativas ao valor que poderia trazer consigo a anotação semântica sistematizada de corpora.Heutzutage wird in der Wörterbuchforschung und in der Lexikographie immer häufiger auf Korpora zurückgegriffen, weil sie als zuverlässige Methode gelten, um repräsentative Beispiele der natürlichen Sprache zu finden. Obgleich die Entwicklung von Tools im Bereich der natürlichen Sprachverarbeitung (NLP) dazu führte, dass die Texte morphosyntaktisch annotiert sind, fehlt es immer noch an einer umfassenden und systematisierten semantischen Annotation. Dieser Mangel wird besonders deutlich, wenn man sich mit der Valenzlexikographie und der Valenzgrammatik befasst, da in der Literatur (vgl. Domínguez, 2011) darauf hingewiesen wird, dass die semantische Valenz wesentlich für die Abgrenzung von Ergänzungen ist, die neben einem als Valenzträger zu betrachtenden Lexem auftreten. Daraus ergibt sich, dass es einem Ansatz zur semantischen Annotation von Korpora bedarf, bei dem die nominalen Ergänzungen und ihr semantisches Verhalten im Vordergrund stehen und der sich zum Ziel setzt, die Grenzen der bereits existierenden morphosyntaktischen Annotation zu überschreiten. Die Valenzgrammatik und -lexikographie sowie die lexikalische Semantik stellen daher den theoretischen Ausgangspunkt der vorliegenden Masterarbeit dar. Die Vorgehensweise dieser Arbeit beschränkt sich auf die Analyse der Argumentstrukturen von drei Substantiven aus dem semantischen Feld der Kommunikation im Deutschen (Bericht, Diskussion und Frage). Mithilfe von Tools der NLP wird ein Skript entwickelt, das einen Abgleich zwischen den aus Korpora stammenden Daten und den lexikalischen Paketen entnommenen Daten ermöglicht. Die sog. lexikalischen Paketen wurden im Rahmen der Projekte PORTLEX, MultiComb und MultiGenera erstellt. Anschließend ist die Zuverlässigkeit des erstellten Skripts zu analysieren und es werden Schlussfolgerungen hinsichtlich des Wertes der systematisierten semantischen Annotation von Korpora gezogen.EMLEX - With the support of the ERASMUS+ Programme of the EuropeanIriarte Sanromán, ÁlvaroDomínguez Vázquez, María JoséUniversidade do MinhoArias Arias, Iván2022-07-182022-07-18T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79649por203039033info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-04T01:17:18Zoai:repositorium.sdum.uminho.pt:1822/79649Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:30:04.617517Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Anotação semântica (semi)automática de corpora: a frase nominal em alemão
(Semi)automatische semantische annotation von korpora: die nominalphrase im deutschen
title Anotação semântica (semi)automática de corpora: a frase nominal em alemão
spellingShingle Anotação semântica (semi)automática de corpora: a frase nominal em alemão
Arias Arias, Iván
Anotação semântica
Corpora
Pacote lexical
PLN
Valência nominal
Semantische annotation
Korpora
Lexikalisches paket
NLP
Nominale valenz
Humanidades::Línguas e Literaturas
title_short Anotação semântica (semi)automática de corpora: a frase nominal em alemão
title_full Anotação semântica (semi)automática de corpora: a frase nominal em alemão
title_fullStr Anotação semântica (semi)automática de corpora: a frase nominal em alemão
title_full_unstemmed Anotação semântica (semi)automática de corpora: a frase nominal em alemão
title_sort Anotação semântica (semi)automática de corpora: a frase nominal em alemão
author Arias Arias, Iván
author_facet Arias Arias, Iván
author_role author
dc.contributor.none.fl_str_mv Iriarte Sanromán, Álvaro
Domínguez Vázquez, María José
Universidade do Minho
dc.contributor.author.fl_str_mv Arias Arias, Iván
dc.subject.por.fl_str_mv Anotação semântica
Corpora
Pacote lexical
PLN
Valência nominal
Semantische annotation
Korpora
Lexikalisches paket
NLP
Nominale valenz
Humanidades::Línguas e Literaturas
topic Anotação semântica
Corpora
Pacote lexical
PLN
Valência nominal
Semantische annotation
Korpora
Lexikalisches paket
NLP
Nominale valenz
Humanidades::Línguas e Literaturas
description Dissertação de mestrado Europeu em Lexicografia
publishDate 2022
dc.date.none.fl_str_mv 2022-07-18
2022-07-18T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/79649
url https://hdl.handle.net/1822/79649
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203039033
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132802595160064