Desambiguação do item lexical corretp através de etiquetadores semânticos: uma abordagem baseada em corpus

Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão. Programa de Pós-Graduação em Linguística.

Access type:openAccess
Publication Date:2007
Main Author: Azevedo, Flávia
Advisor: Rocha, Marco Antônio Esteves da
Document type: Master thesis
Language:por
Published: Florianópolis, SC
Online Access:http://repositorio.ufsc.br/xmlui/handle/123456789/89620
Portuguese abstract:Esta pesquisa tem como objetivo investigar os possíveis sentidos do item lexical correto em um corpus de português escrito. Espera-se utilizar os resultados como subsídio para fundamentar lingüisticamente um sistema capacitado a realizar a desambiguação deste item lexical. A análise do contexto imediato das ocorrências do item lexical no corpus é vista como a fonte fundamental de informações lingüísticas tendo em vista a mencionada desambiguação. O material utilizado no presente trabalho foi coletado do corpus NILC (Núcleo Institucional de Lingüística Computacional), e a análise foi feita através do programa WordSmith (Scott, 1995), um software para a análise de corpora. O estudo deve ser visto como uma contribuição inicial para a definição de uma metodologia de análise de itens lexicais de polissemia complexa que venha a servir de base para investigações semelhantes, uma vez que os diferentes sentidos encontrados podem ser transformados em um conjunto de etiquetas para uso em um etiquetador semântico dentro de um sistema que utiliza tecnologia de análise lingüística.