Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | https://doi.org/10.14393/DL52-v16n4a2022-12 http://hdl.handle.net/1843/61579 https://orcid.org/0000-0002-9855-0646 https://orcid.org/0000-0002-5302-2946 |
Resumo: | Ferramentas e métodos computacionais são, cada vez mais, importantes aliados para a realização de pesquisas no âmbito das humanidades. Em particular, o uso dessas ferramentas é relevante para a análise linguística diacrônica. Neste estudo, é apresentada uma discussão sobre o uso de corpora e datasets na linguística, destacando algumas potencialidades e limitações desses recursos. Para ilustrar as possibilidades de uso de um dataset para pesquisa linguística, apresenta-se, também, uma análise preliminar da Base de Normas Jurídicas Brasileiras. |
id |
UFMG_585d1e07925448272a7edfd7e168a580 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/61579 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
2023-11-30T18:27:43Z2023-11-30T18:27:43Z202216415711607https://doi.org/10.14393/DL52-v16n4a2022-1219805799http://hdl.handle.net/1843/61579https://orcid.org/0000-0002-9855-0646https://orcid.org/0000-0002-5302-2946Ferramentas e métodos computacionais são, cada vez mais, importantes aliados para a realização de pesquisas no âmbito das humanidades. Em particular, o uso dessas ferramentas é relevante para a análise linguística diacrônica. Neste estudo, é apresentada uma discussão sobre o uso de corpora e datasets na linguística, destacando algumas potencialidades e limitações desses recursos. Para ilustrar as possibilidades de uso de um dataset para pesquisa linguística, apresenta-se, também, uma análise preliminar da Base de Normas Jurídicas Brasileiras.Computational tools and methods are increasingly important for conducting research in the humanities. In particular, these tools are relevant for diachronic linguistic analysis. In this study, we present a discussion about the use of corpora and datasets in linguistics, highlighting some strengths and limitations of these resources. To illustrate the possibilities of using a dataset for linguistic research, a preliminary study employing a dataset of Brazilian legal norms is also presented.porUniversidade Federal de Minas GeraisUFMGBrasilFALE - FACULDADE DE LETRASDomínios de Lingu@gemDireito - LinguagemLinguística de corpusProcessamento de textoDataset de normas jurídicasAnálise diacrônicaLinguagem e direitoReflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativosMethodological reflections on datasets and Corpus Linguistics: a preliminary analysis of legislative datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/64146Lucia de Almeida FerrariEvandro Landulfo Teixeira Paradela Cunhaapplication/pdfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGLICENSELicense.txtLicense.txttext/plain; charset=utf-82042https://repositorio.ufmg.br/bitstream/1843/61579/1/License.txtfa505098d172de0bc8864fc1287ffe22MD51ORIGINALReflexões metodológicas sobre datasets e Linguística de Corpus uma análise preliminar de dados legislativos.pdfReflexões metodológicas sobre datasets e Linguística de Corpus uma análise preliminar de dados legislativos.pdfapplication/pdf1155494https://repositorio.ufmg.br/bitstream/1843/61579/2/Reflex%c3%b5es%20metodol%c3%b3gicas%20sobre%20datasets%20e%20Lingu%c3%adstica%20de%20Corpus%20uma%20an%c3%a1lise%20preliminar%20de%20dados%20legislativos.pdf69ea1694fe880a0d67a4198a79b98187MD521843/615792023-11-30 15:27:44.294oai:repositorio.ufmg.br:1843/61579TElDRU7vv71BIERFIERJU1RSSUJVSe+/ve+/vU8gTu+/vU8tRVhDTFVTSVZBIERPIFJFUE9TSVTvv71SSU8gSU5TVElUVUNJT05BTCBEQSBVRk1HCiAKCkNvbSBhIGFwcmVzZW50Ye+/ve+/vW8gZGVzdGEgbGljZW7vv71hLCB2b2Pvv70gKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIGFvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbu+/vW8gZXhjbHVzaXZvIGUgaXJyZXZvZ++/vXZlbCBkZSByZXByb2R1emlyIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNh77+977+9byAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0cu+/vW5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mg77+9dWRpbyBvdSB277+9ZGVvLgoKVm9j77+9IGRlY2xhcmEgcXVlIGNvbmhlY2UgYSBwb2zvv710aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2Pvv70gY29uY29yZGEgcXVlIG8gUmVwb3NpdO+/vXJpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250Ze+/vWRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNh77+977+9byBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHvv73vv71vLgoKVm9j77+9IHRhbWLvv71tIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPvv71waWEgZGUgc3VhIHB1YmxpY2Hvv73vv71vIHBhcmEgZmlucyBkZSBzZWd1cmFu77+9YSwgYmFjay11cCBlIHByZXNlcnZh77+977+9by4KClZvY++/vSBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNh77+977+9byDvv70gb3JpZ2luYWwgZSBxdWUgdm9j77+9IHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vu77+9YS4gVm9j77+9IHRhbWLvv71tIGRlY2xhcmEgcXVlIG8gZGVw77+9c2l0byBkZSBzdWEgcHVibGljYe+/ve+/vW8gbu+/vW8sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd177+9bS4KCkNhc28gYSBzdWEgcHVibGljYe+/ve+/vW8gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY++/vSBu77+9byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2Pvv70gZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc++/vW8gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7vv71hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Tvv70gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250Ze+/vWRvIGRhIHB1YmxpY2Hvv73vv71vIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0Hvv73vv71PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ++/vU5JTyBPVSBBUE9JTyBERSBVTUEgQUfvv71OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0Pvv70gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklT77+9TyBDT01PIFRBTULvv71NIEFTIERFTUFJUyBPQlJJR0Hvv73vv71FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNh77+977+9bywgZSBu77+9byBmYXLvv70gcXVhbHF1ZXIgYWx0ZXJh77+977+9bywgYWzvv71tIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7vv71hLgo=Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-11-30T18:27:44Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
dc.title.alternative.pt_BR.fl_str_mv |
Methodological reflections on datasets and Corpus Linguistics: a preliminary analysis of legislative data |
title |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
spellingShingle |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos Lucia de Almeida Ferrari Processamento de texto Dataset de normas jurídicas Análise diacrônica Linguagem e direito Direito - Linguagem Linguística de corpus |
title_short |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
title_full |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
title_fullStr |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
title_full_unstemmed |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
title_sort |
Reflexões metodológicas sobre datasets e Linguística de Corpus: uma análise preliminar de dados legislativos |
author |
Lucia de Almeida Ferrari |
author_facet |
Lucia de Almeida Ferrari Evandro Landulfo Teixeira Paradela Cunha |
author_role |
author |
author2 |
Evandro Landulfo Teixeira Paradela Cunha |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Lucia de Almeida Ferrari Evandro Landulfo Teixeira Paradela Cunha |
dc.subject.por.fl_str_mv |
Processamento de texto Dataset de normas jurídicas Análise diacrônica Linguagem e direito |
topic |
Processamento de texto Dataset de normas jurídicas Análise diacrônica Linguagem e direito Direito - Linguagem Linguística de corpus |
dc.subject.other.pt_BR.fl_str_mv |
Direito - Linguagem Linguística de corpus |
description |
Ferramentas e métodos computacionais são, cada vez mais, importantes aliados para a realização de pesquisas no âmbito das humanidades. Em particular, o uso dessas ferramentas é relevante para a análise linguística diacrônica. Neste estudo, é apresentada uma discussão sobre o uso de corpora e datasets na linguística, destacando algumas potencialidades e limitações desses recursos. Para ilustrar as possibilidades de uso de um dataset para pesquisa linguística, apresenta-se, também, uma análise preliminar da Base de Normas Jurídicas Brasileiras. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022 |
dc.date.accessioned.fl_str_mv |
2023-11-30T18:27:43Z |
dc.date.available.fl_str_mv |
2023-11-30T18:27:43Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/61579 |
dc.identifier.doi.pt_BR.fl_str_mv |
https://doi.org/10.14393/DL52-v16n4a2022-12 |
dc.identifier.issn.pt_BR.fl_str_mv |
19805799 |
dc.identifier.orcid.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-9855-0646 https://orcid.org/0000-0002-5302-2946 |
url |
https://doi.org/10.14393/DL52-v16n4a2022-12 http://hdl.handle.net/1843/61579 https://orcid.org/0000-0002-9855-0646 https://orcid.org/0000-0002-5302-2946 |
identifier_str_mv |
19805799 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.ispartof.pt_BR.fl_str_mv |
Domínios de Lingu@gem |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
FALE - FACULDADE DE LETRAS |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/61579/1/License.txt https://repositorio.ufmg.br/bitstream/1843/61579/2/Reflex%c3%b5es%20metodol%c3%b3gicas%20sobre%20datasets%20e%20Lingu%c3%adstica%20de%20Corpus%20uma%20an%c3%a1lise%20preliminar%20de%20dados%20legislativos.pdf |
bitstream.checksum.fl_str_mv |
fa505098d172de0bc8864fc1287ffe22 69ea1694fe880a0d67a4198a79b98187 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589212997419008 |