Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos

Detalhes bibliográficos
Autor(a) principal: Lucia de Almeida Ferrari
Data de Publicação: 2022
Outros Autores: Evandro Landulfo Teixeira Paradela Cunha
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: https://doi.org/10.14393/DL52-v16n4a2022-12
http://hdl.handle.net/1843/61579
https://orcid.org/0000-0002-9855-0646
https://orcid.org/0000-0002-5302-2946
Resumo: Ferramentas e métodos computacionais são, cada vez mais, importantes aliados para a realização de pesquisas no âmbito das humanidades. Em particular, o uso dessas ferramentas é relevante para a análise linguística diacrônica. Neste estudo, é apresentada uma discussão sobre o uso de corpora e datasets na linguística, destacando algumas potencialidades e limitações desses recursos. Para ilustrar as possibilidades de uso de um dataset para pesquisa linguística, apresenta-se, também, uma análise preliminar da Base de Normas Jurídicas Brasileiras.
id UFMG_585d1e07925448272a7edfd7e168a580
oai_identifier_str oai:repositorio.ufmg.br:1843/61579
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling 2023-11-30T18:27:43Z2023-11-30T18:27:43Z202216415711607https://doi.org/10.14393/DL52-v16n4a2022-1219805799http://hdl.handle.net/1843/61579https://orcid.org/0000-0002-9855-0646https://orcid.org/0000-0002-5302-2946Ferramentas e métodos computacionais são, cada vez mais, importantes aliados para a realização de pesquisas no âmbito das humanidades. Em particular, o uso dessas ferramentas é relevante para a análise linguística diacrônica. Neste estudo, é apresentada uma discussão sobre o uso de corpora e datasets na linguística, destacando algumas potencialidades e limitações desses recursos. Para ilustrar as possibilidades de uso de um dataset para pesquisa linguística, apresenta-se, também, uma análise preliminar da Base de Normas Jurídicas Brasileiras.Computational tools and methods are increasingly important for conducting research in the humanities. In particular, these tools are relevant for diachronic linguistic analysis. In this study, we present a discussion about the use of corpora and datasets in linguistics, highlighting some strengths and limitations of these resources. To illustrate the possibilities of using a dataset for linguistic research, a preliminary study employing a dataset of Brazilian legal norms is also presented.porUniversidade Federal de Minas GeraisUFMGBrasilFALE - FACULDADE DE LETRASDomínios de Lingu@gemDireito - LinguagemLinguística de corpusProcessamento de textoDataset de normas jurídicasAnálise diacrônicaLinguagem e direitoReflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativosMethodological reflections on datasets and Corpus Linguistics: a preliminary analysis of legislative datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/64146Lucia de Almeida FerrariEvandro Landulfo Teixeira Paradela Cunhaapplication/pdfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGLICENSELicense.txtLicense.txttext/plain; charset=utf-82042https://repositorio.ufmg.br/bitstream/1843/61579/1/License.txtfa505098d172de0bc8864fc1287ffe22MD51ORIGINALReflexões metodológicas sobre datasets e Linguística de Corpus uma análise preliminar de dados legislativos.pdfReflexões metodológicas sobre datasets e Linguística de Corpus uma análise preliminar de dados legislativos.pdfapplication/pdf1155494https://repositorio.ufmg.br/bitstream/1843/61579/2/Reflex%c3%b5es%20metodol%c3%b3gicas%20sobre%20datasets%20e%20Lingu%c3%adstica%20de%20Corpus%20uma%20an%c3%a1lise%20preliminar%20de%20dados%20legislativos.pdf69ea1694fe880a0d67a4198a79b98187MD521843/615792023-11-30 15:27:44.294oai:repositorio.ufmg.br:1843/61579TElDRU7vv71BIERFIERJU1RSSUJVSe+/ve+/vU8gTu+/vU8tRVhDTFVTSVZBIERPIFJFUE9TSVTvv71SSU8gSU5TVElUVUNJT05BTCBEQSBVRk1HCiAKCkNvbSBhIGFwcmVzZW50Ye+/ve+/vW8gZGVzdGEgbGljZW7vv71hLCB2b2Pvv70gKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIGFvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbu+/vW8gZXhjbHVzaXZvIGUgaXJyZXZvZ++/vXZlbCBkZSByZXByb2R1emlyIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNh77+977+9byAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0cu+/vW5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mg77+9dWRpbyBvdSB277+9ZGVvLgoKVm9j77+9IGRlY2xhcmEgcXVlIGNvbmhlY2UgYSBwb2zvv710aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2Pvv70gY29uY29yZGEgcXVlIG8gUmVwb3NpdO+/vXJpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250Ze+/vWRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNh77+977+9byBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHvv73vv71vLgoKVm9j77+9IHRhbWLvv71tIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPvv71waWEgZGUgc3VhIHB1YmxpY2Hvv73vv71vIHBhcmEgZmlucyBkZSBzZWd1cmFu77+9YSwgYmFjay11cCBlIHByZXNlcnZh77+977+9by4KClZvY++/vSBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNh77+977+9byDvv70gb3JpZ2luYWwgZSBxdWUgdm9j77+9IHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vu77+9YS4gVm9j77+9IHRhbWLvv71tIGRlY2xhcmEgcXVlIG8gZGVw77+9c2l0byBkZSBzdWEgcHVibGljYe+/ve+/vW8gbu+/vW8sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd177+9bS4KCkNhc28gYSBzdWEgcHVibGljYe+/ve+/vW8gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY++/vSBu77+9byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2Pvv70gZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc++/vW8gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7vv71hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Tvv70gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250Ze+/vWRvIGRhIHB1YmxpY2Hvv73vv71vIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0Hvv73vv71PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ++/vU5JTyBPVSBBUE9JTyBERSBVTUEgQUfvv71OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0Pvv70gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklT77+9TyBDT01PIFRBTULvv71NIEFTIERFTUFJUyBPQlJJR0Hvv73vv71FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNh77+977+9bywgZSBu77+9byBmYXLvv70gcXVhbHF1ZXIgYWx0ZXJh77+977+9bywgYWzvv71tIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7vv71hLgo=Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-11-30T18:27:44Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
dc.title.alternative.pt_BR.fl_str_mv Methodological reflections on datasets and Corpus Linguistics: a preliminary analysis of legislative data
title Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
spellingShingle Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
Lucia de Almeida Ferrari
Processamento de texto
Dataset de normas jurídicas
Análise diacrônica
Linguagem e direito
Direito - Linguagem
Linguística de corpus
title_short Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
title_full Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
title_fullStr Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
title_full_unstemmed Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
title_sort Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
author Lucia de Almeida Ferrari
author_facet Lucia de Almeida Ferrari
Evandro Landulfo Teixeira Paradela Cunha
author_role author
author2 Evandro Landulfo Teixeira Paradela Cunha
author2_role author
dc.contributor.author.fl_str_mv Lucia de Almeida Ferrari
Evandro Landulfo Teixeira Paradela Cunha
dc.subject.por.fl_str_mv Processamento de texto
Dataset de normas jurídicas
Análise diacrônica
Linguagem e direito
topic Processamento de texto
Dataset de normas jurídicas
Análise diacrônica
Linguagem e direito
Direito - Linguagem
Linguística de corpus
dc.subject.other.pt_BR.fl_str_mv Direito - Linguagem
Linguística de corpus
description Ferramentas e métodos computacionais são, cada vez mais, importantes aliados para a realização de pesquisas no âmbito das humanidades. Em particular, o uso dessas ferramentas é relevante para a análise linguística diacrônica. Neste estudo, é apresentada uma discussão sobre o uso de corpora e datasets na linguística, destacando algumas potencialidades e limitações desses recursos. Para ilustrar as possibilidades de uso de um dataset para pesquisa linguística, apresenta-se, também, uma análise preliminar da Base de Normas Jurídicas Brasileiras.
publishDate 2022
dc.date.issued.fl_str_mv 2022
dc.date.accessioned.fl_str_mv 2023-11-30T18:27:43Z
dc.date.available.fl_str_mv 2023-11-30T18:27:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/61579
dc.identifier.doi.pt_BR.fl_str_mv https://doi.org/10.14393/DL52-v16n4a2022-12
dc.identifier.issn.pt_BR.fl_str_mv 19805799
dc.identifier.orcid.pt_BR.fl_str_mv https://orcid.org/0000-0002-9855-0646
https://orcid.org/0000-0002-5302-2946
url https://doi.org/10.14393/DL52-v16n4a2022-12
http://hdl.handle.net/1843/61579
https://orcid.org/0000-0002-9855-0646
https://orcid.org/0000-0002-5302-2946
identifier_str_mv 19805799
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.pt_BR.fl_str_mv Domínios de Lingu@gem
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv FALE - FACULDADE DE LETRAS
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/61579/1/License.txt
https://repositorio.ufmg.br/bitstream/1843/61579/2/Reflex%c3%b5es%20metodol%c3%b3gicas%20sobre%20datasets%20e%20Lingu%c3%adstica%20de%20Corpus%20uma%20an%c3%a1lise%20preliminar%20de%20dados%20legislativos.pdf
bitstream.checksum.fl_str_mv fa505098d172de0bc8864fc1287ffe22
69ea1694fe880a0d67a4198a79b98187
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589212997419008