Anotação semântica (semi)automática de corpora: a frase nominal em alemão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/79649 |
Resumo: | Dissertação de mestrado Europeu em Lexicografia |
id |
RCAP_99f72e4c0a267d187155e8ed4610ed5a |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/79649 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão(Semi)automatische semantische annotation von korpora: die nominalphrase im deutschenAnotação semânticaCorporaPacote lexicalPLNValência nominalSemantische annotationKorporaLexikalisches paketNLPNominale valenzHumanidades::Línguas e LiteraturasDissertação de mestrado Europeu em LexicografiaNos dias de hoje, no âmbito da investigação e da prática lexicográfica, a utilização de corpora tem-se revelado muito recorrente, principalmente pelo facto de ser considerada como a metodologia mais fiável para alcançarmos exemplos representativos das línguas naturais. Embora as ferramentas de Processamento de Língua Natural (PLN) tenham conseguido grandes avanços na anotação morfossintática de textos, continua a faltar uma anotação semântica exaustiva e sistematizada. Esta carência evidencia-se principalmente quando se fala em lexicografia e gramática de valências, pois na bibliografia teórica (cf. Domínguez, 2011) aponta-se para o facto de a valência semântica ser fulcral para a delimitação de argumentos que acompanham um lexema considerado como portador de valência. Daí surge, no contexto desta investigação, a necessidade de uma aproximação à anotação semântica de corpora, em que se preste atenção especial aos argumentos no nível da frase nominal e ao seu comportamento semântico, para além da etiquetagem morfossintática com a qual contamos normalmente. A gramática e lexicografia de valências, assim como a semântica léxica, constituem, portanto, o ponto de partida teórico da presente dissertação de mestrado. No que diz respeito à metodologia, o presente trabalho cingir-se-á à análise das estruturas argumentais de três nomes do campo semântico da comunicação em alemão (Bericht, Diskussion e Frage) e, através de metodologia de PLN, desenhar-se-á um API script que possibilite o cruzamento de dados de corpora com alguns pacotes lexicais delimitados e criados no âmbito dos projetos PORTLEX, MultiGenera e MultiComb. Esta metodologia permitir-nos-á analisar, a posteriori, a fiabilidade do script desenvolvido, e conduzirá para a extração de conclusões relativas ao valor que poderia trazer consigo a anotação semântica sistematizada de corpora.Heutzutage wird in der Wörterbuchforschung und in der Lexikographie immer häufiger auf Korpora zurückgegriffen, weil sie als zuverlässige Methode gelten, um repräsentative Beispiele der natürlichen Sprache zu finden. Obgleich die Entwicklung von Tools im Bereich der natürlichen Sprachverarbeitung (NLP) dazu führte, dass die Texte morphosyntaktisch annotiert sind, fehlt es immer noch an einer umfassenden und systematisierten semantischen Annotation. Dieser Mangel wird besonders deutlich, wenn man sich mit der Valenzlexikographie und der Valenzgrammatik befasst, da in der Literatur (vgl. Domínguez, 2011) darauf hingewiesen wird, dass die semantische Valenz wesentlich für die Abgrenzung von Ergänzungen ist, die neben einem als Valenzträger zu betrachtenden Lexem auftreten. Daraus ergibt sich, dass es einem Ansatz zur semantischen Annotation von Korpora bedarf, bei dem die nominalen Ergänzungen und ihr semantisches Verhalten im Vordergrund stehen und der sich zum Ziel setzt, die Grenzen der bereits existierenden morphosyntaktischen Annotation zu überschreiten. Die Valenzgrammatik und -lexikographie sowie die lexikalische Semantik stellen daher den theoretischen Ausgangspunkt der vorliegenden Masterarbeit dar. Die Vorgehensweise dieser Arbeit beschränkt sich auf die Analyse der Argumentstrukturen von drei Substantiven aus dem semantischen Feld der Kommunikation im Deutschen (Bericht, Diskussion und Frage). Mithilfe von Tools der NLP wird ein Skript entwickelt, das einen Abgleich zwischen den aus Korpora stammenden Daten und den lexikalischen Paketen entnommenen Daten ermöglicht. Die sog. lexikalischen Paketen wurden im Rahmen der Projekte PORTLEX, MultiComb und MultiGenera erstellt. Anschließend ist die Zuverlässigkeit des erstellten Skripts zu analysieren und es werden Schlussfolgerungen hinsichtlich des Wertes der systematisierten semantischen Annotation von Korpora gezogen.EMLEX - With the support of the ERASMUS+ Programme of the EuropeanIriarte Sanromán, ÁlvaroDomínguez Vázquez, María JoséUniversidade do MinhoArias Arias, Iván2022-07-182022-07-18T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79649por203039033info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-04T01:17:18Zoai:repositorium.sdum.uminho.pt:1822/79649Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:30:04.617517Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão (Semi)automatische semantische annotation von korpora: die nominalphrase im deutschen |
title |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão |
spellingShingle |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão Arias Arias, Iván Anotação semântica Corpora Pacote lexical PLN Valência nominal Semantische annotation Korpora Lexikalisches paket NLP Nominale valenz Humanidades::Línguas e Literaturas |
title_short |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão |
title_full |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão |
title_fullStr |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão |
title_full_unstemmed |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão |
title_sort |
Anotação semântica (semi)automática de corpora: a frase nominal em alemão |
author |
Arias Arias, Iván |
author_facet |
Arias Arias, Iván |
author_role |
author |
dc.contributor.none.fl_str_mv |
Iriarte Sanromán, Álvaro Domínguez Vázquez, María José Universidade do Minho |
dc.contributor.author.fl_str_mv |
Arias Arias, Iván |
dc.subject.por.fl_str_mv |
Anotação semântica Corpora Pacote lexical PLN Valência nominal Semantische annotation Korpora Lexikalisches paket NLP Nominale valenz Humanidades::Línguas e Literaturas |
topic |
Anotação semântica Corpora Pacote lexical PLN Valência nominal Semantische annotation Korpora Lexikalisches paket NLP Nominale valenz Humanidades::Línguas e Literaturas |
description |
Dissertação de mestrado Europeu em Lexicografia |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-07-18 2022-07-18T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/79649 |
url |
https://hdl.handle.net/1822/79649 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
203039033 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132802595160064 |