INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL

Detalhes bibliográficos
Autor(a) principal: Jorge Luiz Nunes dos Santos Junior
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMS
Texto Completo: https://repositorio.ufms.br/handle/123456789/5845
Resumo: This Thesis is located at the intersection of Lexicography with Dialectology and Computational Linguistics and arises from the need to contribute to filling the gap related to the lexicographical and electronic treatment of the dialectal data from the Atlas Linguístico do Brasil (AliB) Project, documented in 18 locations which compose the network of the ALiB Project points, at the interior from Brazil Northern region and, by extension, collaborate with the Brazilian Dialectal Dictionary (MACHADO FILHO, 2010) which aims to produce a dialect dictionary from ALiB data. The main study objective is to produce and to present a digital lexicographical prototype developed from ALiB Project dialectal corpus. Thus, the final product of this Thesis is characterized by a set of electronic tools which compose the prototype of the Dialectal Vocabulary from the Brazil Northern region (VoDiNorte), available at the link <http://vodinorte.bombadil.fr/>. These tools are capable of retrieving structured dialectal information from an XML (Extensible Markup Language) database and present it to the user in a lexicographic organization. These tools are classified into two groups: i) prototypical tools - designed for the common and intermediate user and resembling conventional electronic lexicographic products, and ii) an advanced search engine in the research corpus, aimed at the advanced user, which is innovative from the perspective of Electronic Lexicography. Furthermore, the Thesis presents the methodology employed to encourage linguistics researchers to rethink the outsourcing of services related to low-complexity software programming, opening up space to the exploration of a new horizon in which the scholar can invest in specific knowledge to develop their own computational tools, that is, the creation of computerized solutions that meet specific objectives of a particular scientific research. In summary, this Thesis demonstrates not only the functionalities of the VoDiNorte prototype as a product but also extends an invitation to researchers in Linguistics related areas to consider the possibility of creating their own research corpora in XML, experimenting with ways of manipulating data and retrieving information in an automated and personalized manner, similar to the VoDiNorte prototype, which can be seen, from a technical standpoint, as a web application that functions from an XML database. Further the database of this Thesis can serve as a basis to another products and/or integrate another projects such as the Dicionário Dialetal Brasileiro (MACHADO FILHO, 2010), given that XML is a compatible and easy to use language alongside other computerized systems. We highlight that this research is based on Lexicography (TARP, 2019; 2018; 2011; 2008); (FUERTES-OLIVERA; BERGENHOLTZ, 2015); (FUERTES-OLIVERA; TARP, 2014); (LEROYER, 2011); (PORTO DAPENA, 2004), on Dialectology (CARDOSO, 2010); (RADTKE; THUN, 1996); (CHAMBERS; TRUDGILL, 1994); on Corpus Linguistics (McENERY; HARDIE, 2012); (O'KEEFFE; MCCARTHY, 2010); (BERBER SARDINHA, 2004); (SINCLAIR, 1991) and on Computational Linguistics (KEDIA; RASU, 2020); (SRINIVASA-DESIKAN, 2018); (HARERT, 2004; 2005). Finally, the research demonstrated that creating XML databases for lexical data provides researchers with subsidies to the development of computational tools that can be useful to linguistic studies, in addition to enabling the creation of digital products from data of a scientific research. Keywords: ALiB Project; Lexicography; Dialectology; XML database; computational tools.
id UFMS_42b0290739e9ca64afc9be8582dc1212
oai_identifier_str oai:repositorio.ufms.br:123456789/5845
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str 2124
spelling 2023-05-02T23:39:29Z2023-05-02T23:39:29Z2023https://repositorio.ufms.br/handle/123456789/5845This Thesis is located at the intersection of Lexicography with Dialectology and Computational Linguistics and arises from the need to contribute to filling the gap related to the lexicographical and electronic treatment of the dialectal data from the Atlas Linguístico do Brasil (AliB) Project, documented in 18 locations which compose the network of the ALiB Project points, at the interior from Brazil Northern region and, by extension, collaborate with the Brazilian Dialectal Dictionary (MACHADO FILHO, 2010) which aims to produce a dialect dictionary from ALiB data. The main study objective is to produce and to present a digital lexicographical prototype developed from ALiB Project dialectal corpus. Thus, the final product of this Thesis is characterized by a set of electronic tools which compose the prototype of the Dialectal Vocabulary from the Brazil Northern region (VoDiNorte), available at the link <http://vodinorte.bombadil.fr/>. These tools are capable of retrieving structured dialectal information from an XML (Extensible Markup Language) database and present it to the user in a lexicographic organization. These tools are classified into two groups: i) prototypical tools - designed for the common and intermediate user and resembling conventional electronic lexicographic products, and ii) an advanced search engine in the research corpus, aimed at the advanced user, which is innovative from the perspective of Electronic Lexicography. Furthermore, the Thesis presents the methodology employed to encourage linguistics researchers to rethink the outsourcing of services related to low-complexity software programming, opening up space to the exploration of a new horizon in which the scholar can invest in specific knowledge to develop their own computational tools, that is, the creation of computerized solutions that meet specific objectives of a particular scientific research. In summary, this Thesis demonstrates not only the functionalities of the VoDiNorte prototype as a product but also extends an invitation to researchers in Linguistics related areas to consider the possibility of creating their own research corpora in XML, experimenting with ways of manipulating data and retrieving information in an automated and personalized manner, similar to the VoDiNorte prototype, which can be seen, from a technical standpoint, as a web application that functions from an XML database. Further the database of this Thesis can serve as a basis to another products and/or integrate another projects such as the Dicionário Dialetal Brasileiro (MACHADO FILHO, 2010), given that XML is a compatible and easy to use language alongside other computerized systems. We highlight that this research is based on Lexicography (TARP, 2019; 2018; 2011; 2008); (FUERTES-OLIVERA; BERGENHOLTZ, 2015); (FUERTES-OLIVERA; TARP, 2014); (LEROYER, 2011); (PORTO DAPENA, 2004), on Dialectology (CARDOSO, 2010); (RADTKE; THUN, 1996); (CHAMBERS; TRUDGILL, 1994); on Corpus Linguistics (McENERY; HARDIE, 2012); (O'KEEFFE; MCCARTHY, 2010); (BERBER SARDINHA, 2004); (SINCLAIR, 1991) and on Computational Linguistics (KEDIA; RASU, 2020); (SRINIVASA-DESIKAN, 2018); (HARERT, 2004; 2005). Finally, the research demonstrated that creating XML databases for lexical data provides researchers with subsidies to the development of computational tools that can be useful to linguistic studies, in addition to enabling the creation of digital products from data of a scientific research. Keywords: ALiB Project; Lexicography; Dialectology; XML database; computational tools.Esta Tese situa-se na intersecção da Lexicografia com a Dialetologia e a Linguística Computacional e surge da necessidade de contribuir para o preenchimento da lacuna relacionada ao tratamento lexicográfico e eletrônico dos dados dialetais do Projeto Atlas Linguístico do Brasil (ALiB), no caso, os documentados nas 18 localidades que compõem a rede de pontos do Projeto ALiB, no interior da região Norte do Brasil e, por extensão, colaborar com o Dicionário Dialetal Brasileiro (MACHADO FILHO, 2010) que tem como propósito produzir um dicionário dialetal a partir dos dados do ALiB. O estudo tem como objetivo principal produzir e apresentar um protótipo lexicográfico digital desenvolvido a partir do corpus dialetal do Projeto ALiB documentado no interior da região Norte do país. Assim, o produto final desta Tese se caracteriza por um conjunto de ferramentas eletrônicas que formam o protótipo do Vocabulário Dialetal da região Norte do Brasil (VoDiNorte), disponível no link <http://vodinorte.bombadil.fr/>. Essas ferramentas, por sua vez, são capazes de recuperar informações dialetais estruturadas em um banco de dados em XML (Extensible Markup Language) e apresentá-las ao usuário em uma organização lexicográfica. Destacamos, ainda, que essas ferramentas estão classificadas em dois grupos, a saber: i) ferramentas prototípicas – destinadas ao usuário comum e intermediário e que se assemelham aos produtos lexicográficos eletrônicos convencionais e, ii) um motor de busca avançada no corpus de pesquisa, voltado para atender ao usuário avançado, que se caracteriza como um produto inovador do ponto de vista da Lexicografia Eletrônica. Além disso, a Tese apresenta a metodologia empregada com o objetivo de encorajar pesquisadores do ramo da Linguística a repensarem a terceirização de serviços relacionados à programação de softwares de baixa complexidade, abrindo espaço para a exploração de um novo horizonte em que o estudioso pode investir em conhecimentos pontuais para desenvolver suas próprias ferramentas computacionais, ou seja, a criação de soluções informatizadas que atendam a objetivos específicos de uma determinada pesquisa científica. Em síntese, esta Tese demonstra não apenas as funcionalidades do protótipo do VoDiNorte, como também estende um convite aos pesquisadores das áreas relacionadas à Linguística, para que possam considerar a possibilidade de criarem seus corpora de pesquisa em XML experimentando, assim, as maneiras de manipulação de dados e de recuperação de informação de forma automatizada e personalizada a exemplo do protótipo do VoDiNorte que pode ser visto, sob um viés técnico, como uma aplicação web que funciona a partir de uma base de dados em XML. Além disso, o banco de dados desta Tese pode servir de base para outros produtos e/ou integrar outros projetos como, por exemplo, o Dicionário Dialetal Brasileiro (MACHADO FILHO, 2010) tendo em vista que o XML é uma linguagem compatível e de fácil utilização junto a outros sistemas informatizados. Destacamos, ainda, que esta pesquisa está fundamentada na Lexicografia (TARP, 2019; 2018; 2011; 2008); (FUERTES- OLIVERA; BERGENHOLTZ, 2015); (FUERTES-OLIVERA; TARP, 2014); (LEROYER, 2011); (PORTO DAPENA, 2004), na Dialetologia (CARDOSO, 2010); (RADTKE; THUN, 1996); (CHAMBERS; TRUDGILL, 1994); Linguística de Corpus (McENERY; HARDIE, 2012); (O‟KEEFFE; McCARTHY, 2010); (BERBER SARDINHA, 2004); (SINCLAIR, 1991) e na Linguística Computacional (KEDIA; RASU, 2020); (SRINIVASA-DESIKAN, 2018); (HARERT, 2004; 2005). Por fim, a pesquisa demonstrou que a criação de bases de dados em XML para o processamento de dados lexicais fornece ao pesquisador subsídios para o desenvolvimento de ferramentas computacionais que podem ser úteis aos estudos linguísticos, além de possibilitarem a criação de produtos digitais a partir de dados de uma pesquisa científica. Palavras-chave: Projeto ALiB; Lexicografia; Dialetologia; banco de dados em XML ferramentas computacionais.Fundação Universidade Federal de Mato Grosso do SulUFMSBrasilProjeto ALiBLexicografiaDialetologiabanco de dados em XML ferramentas computacionais.INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASILinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisAparecida Negri IsquerdoJorge Luiz Nunes dos Santos Juniorinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSORIGINALSANTOS_JUNIOR_2023_Interfaces entre Lexicografia e Dialetologia--Prototipo-VoDiNorte.pdfSANTOS_JUNIOR_2023_Interfaces entre Lexicografia e Dialetologia--Prototipo-VoDiNorte.pdfapplication/pdf4252818https://repositorio.ufms.br/bitstream/123456789/5845/-1/SANTOS_JUNIOR_2023_Interfaces%20entre%20Lexicografia%20e%20Dialetologia--Prototipo-VoDiNorte.pdf3f003507a3f476123a6e48d9088f9b73MD5-1123456789/58452023-05-02 19:39:31.414oai:repositorio.ufms.br:123456789/5845Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242023-05-02T23:39:31Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
title INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
spellingShingle INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
Jorge Luiz Nunes dos Santos Junior
Projeto ALiB
Lexicografia
Dialetologia
banco de dados em XML ferramentas computacionais.
title_short INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
title_full INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
title_fullStr INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
title_full_unstemmed INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
title_sort INTERFACES ENTRE LEXICOGRAFIA EDIALETOLOGIA: POR UM PROTÓTIPO DEVOCABULÁRIO DIALETAL ELETRÔNICO DAREGIÃO NORTE DO BRASIL
author Jorge Luiz Nunes dos Santos Junior
author_facet Jorge Luiz Nunes dos Santos Junior
author_role author
dc.contributor.advisor1.fl_str_mv Aparecida Negri Isquerdo
dc.contributor.author.fl_str_mv Jorge Luiz Nunes dos Santos Junior
contributor_str_mv Aparecida Negri Isquerdo
dc.subject.por.fl_str_mv Projeto ALiB
Lexicografia
Dialetologia
banco de dados em XML ferramentas computacionais.
topic Projeto ALiB
Lexicografia
Dialetologia
banco de dados em XML ferramentas computacionais.
description This Thesis is located at the intersection of Lexicography with Dialectology and Computational Linguistics and arises from the need to contribute to filling the gap related to the lexicographical and electronic treatment of the dialectal data from the Atlas Linguístico do Brasil (AliB) Project, documented in 18 locations which compose the network of the ALiB Project points, at the interior from Brazil Northern region and, by extension, collaborate with the Brazilian Dialectal Dictionary (MACHADO FILHO, 2010) which aims to produce a dialect dictionary from ALiB data. The main study objective is to produce and to present a digital lexicographical prototype developed from ALiB Project dialectal corpus. Thus, the final product of this Thesis is characterized by a set of electronic tools which compose the prototype of the Dialectal Vocabulary from the Brazil Northern region (VoDiNorte), available at the link <http://vodinorte.bombadil.fr/>. These tools are capable of retrieving structured dialectal information from an XML (Extensible Markup Language) database and present it to the user in a lexicographic organization. These tools are classified into two groups: i) prototypical tools - designed for the common and intermediate user and resembling conventional electronic lexicographic products, and ii) an advanced search engine in the research corpus, aimed at the advanced user, which is innovative from the perspective of Electronic Lexicography. Furthermore, the Thesis presents the methodology employed to encourage linguistics researchers to rethink the outsourcing of services related to low-complexity software programming, opening up space to the exploration of a new horizon in which the scholar can invest in specific knowledge to develop their own computational tools, that is, the creation of computerized solutions that meet specific objectives of a particular scientific research. In summary, this Thesis demonstrates not only the functionalities of the VoDiNorte prototype as a product but also extends an invitation to researchers in Linguistics related areas to consider the possibility of creating their own research corpora in XML, experimenting with ways of manipulating data and retrieving information in an automated and personalized manner, similar to the VoDiNorte prototype, which can be seen, from a technical standpoint, as a web application that functions from an XML database. Further the database of this Thesis can serve as a basis to another products and/or integrate another projects such as the Dicionário Dialetal Brasileiro (MACHADO FILHO, 2010), given that XML is a compatible and easy to use language alongside other computerized systems. We highlight that this research is based on Lexicography (TARP, 2019; 2018; 2011; 2008); (FUERTES-OLIVERA; BERGENHOLTZ, 2015); (FUERTES-OLIVERA; TARP, 2014); (LEROYER, 2011); (PORTO DAPENA, 2004), on Dialectology (CARDOSO, 2010); (RADTKE; THUN, 1996); (CHAMBERS; TRUDGILL, 1994); on Corpus Linguistics (McENERY; HARDIE, 2012); (O'KEEFFE; MCCARTHY, 2010); (BERBER SARDINHA, 2004); (SINCLAIR, 1991) and on Computational Linguistics (KEDIA; RASU, 2020); (SRINIVASA-DESIKAN, 2018); (HARERT, 2004; 2005). Finally, the research demonstrated that creating XML databases for lexical data provides researchers with subsidies to the development of computational tools that can be useful to linguistic studies, in addition to enabling the creation of digital products from data of a scientific research. Keywords: ALiB Project; Lexicography; Dialectology; XML database; computational tools.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-05-02T23:39:29Z
dc.date.available.fl_str_mv 2023-05-02T23:39:29Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/5845
url https://repositorio.ufms.br/handle/123456789/5845
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Fundação Universidade Federal de Mato Grosso do Sul
dc.publisher.initials.fl_str_mv UFMS
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Fundação Universidade Federal de Mato Grosso do Sul
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/5845/-1/SANTOS_JUNIOR_2023_Interfaces%20entre%20Lexicografia%20e%20Dialetologia--Prototipo-VoDiNorte.pdf
bitstream.checksum.fl_str_mv 3f003507a3f476123a6e48d9088f9b73
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1801678546756698112