ToGatherUp: um protótipo de ferramenta para a construção de corpora

Detalhes bibliográficos
Autor(a) principal: Oliveira, Fernando Paulino de
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/25433
http://dx.doi.org/10.14393/ufu.di.2019.679
Resumo: Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.
id UFU_0cbc9de0d3516931a8e9ed2426e549d3
oai_identifier_str oai:repositorio.ufu.br:123456789/25433
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling 2019-06-19T15:30:02Z2019-06-19T15:30:02Z2019-05-30OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: http://dx.doi.org/10.14393/ufu.di.2019.679.https://repositorio.ufu.br/handle/123456789/25433http://dx.doi.org/10.14393/ufu.di.2019.679Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.This research verifies the effects of incorporating the ToGatherUp tool on both time and effort for building manually the corpus presented herein: the Corpus of Computing in English (CoCLI). We have developed a set of effort measurement metrics – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The theory and methodology of Corpus Linguistics, together with the concepts from Project Management, subsidized our proposal of systematizing the manual construction of corpora and for creating the two versions of the CoCLI and, along with the notions of the Computing area, guided us in the development of ToGatherUp. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora.Dissertação (Mestrado)porUniversidade Federal de UberlândiaPrograma de Pós-graduação em Estudos LinguísticosBrasilhttp://creativecommons.org/publicdomain/zero/1.0/info:eu-repo/semantics/openAccessCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICALinguística de corpusConstrução manual de corpusCoCLIMétricas de medição de esforçoToGatherUpLinguísticaLíngua inglesa - ComputaçãoCorpus LinguisticsManual construction of corpusEffort measurement metricsToGatherUp: um protótipo de ferramenta para a construção de corporaToGatherUp: a prototype tool for building corporainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisFromm, Guilhermehttp://lattes.cnpq.br/6627254642763875Silva, Igorhttp://lattes.cnpq.br/6440150670404908Tagnin, Stellahttp://lattes.cnpq.br/4402771732265181Novodvorski, Arielhttp://lattes.cnpq.br/2882362453894798http://lattes.cnpq.br/7359501221998166Oliveira, Fernando Paulino de21958674994reponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFUORIGINALToGatherUpProtótipoFerramentaToGatherUpProtótipoFerramentaDissertação de Fernando Paulino de Oliveira.application/pdf3272353https://repositorio.ufu.br/bitstream/123456789/25433/1/ToGatherUpProt%c3%b3tipoFerramenta311ae5c544a9488aa929876fbaf746aeMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8701https://repositorio.ufu.br/bitstream/123456789/25433/2/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81792https://repositorio.ufu.br/bitstream/123456789/25433/3/license.txt48ded82ce41b8d2426af12aed6b3cbf3MD53TEXTToGatherUpProtótipoFerramenta.txtToGatherUpProtótipoFerramenta.txtExtracted texttext/plain407424https://repositorio.ufu.br/bitstream/123456789/25433/4/ToGatherUpProt%c3%b3tipoFerramenta.txt30ef2cfc3c7593f491fa688501d1d1c5MD54THUMBNAILToGatherUpProtótipoFerramenta.jpgToGatherUpProtótipoFerramenta.jpgGenerated Thumbnailimage/jpeg1221https://repositorio.ufu.br/bitstream/123456789/25433/5/ToGatherUpProt%c3%b3tipoFerramenta.jpg0e83a78cb05af4e636cc14ab69d2d803MD55123456789/254332019-06-20 03:06:29.696oai:repositorio.ufu.br:123456789/25433w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLCBhbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbm8gUmVwb3NpdMOzcmlvLiBQb3IgZmF2b3IsIGxlaWEgYSBsaWNlbsOnYSBhdGVudGFtZW50ZS4gQ2FzbyBuZWNlc3NpdGUgZGUgYWxndW0gZXNjbGFyZWNpbWVudG8gZW50cmUgZW0gY29udGF0byBhdHJhdsOpcyBkbyBlLW1haWwgIHJlcG9zaXRvcmlvQHVmdS5ici4KCkxJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBbyBhc3NpbmFyIGUgZW50cmVnYXIgZXN0YSBsaWNlbsOnYSwgby9hIFNyLi9TcmEuIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpOgoKYSkgQ29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0gZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLgoKU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldShzKSBub21lKHMpIGNvbW8gbyhzKSBhdXRvcihlcykgb3UgZGV0ZW50b3IgKGVzKSBkb3MgZGlyZWl0b3MgZG8gZG9jdW1lbnRvIGVudHJlZ3VlLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2024-04-26T15:12:50.087632Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.pt_BR.fl_str_mv ToGatherUp: um protótipo de ferramenta para a construção de corpora
dc.title.alternative.pt_BR.fl_str_mv ToGatherUp: a prototype tool for building corpora
title ToGatherUp: um protótipo de ferramenta para a construção de corpora
spellingShingle ToGatherUp: um protótipo de ferramenta para a construção de corpora
Oliveira, Fernando Paulino de
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA
Linguística de corpus
Construção manual de corpus
CoCLI
Métricas de medição de esforço
ToGatherUp
Linguística
Língua inglesa - Computação
Corpus Linguistics
Manual construction of corpus
Effort measurement metrics
title_short ToGatherUp: um protótipo de ferramenta para a construção de corpora
title_full ToGatherUp: um protótipo de ferramenta para a construção de corpora
title_fullStr ToGatherUp: um protótipo de ferramenta para a construção de corpora
title_full_unstemmed ToGatherUp: um protótipo de ferramenta para a construção de corpora
title_sort ToGatherUp: um protótipo de ferramenta para a construção de corpora
author Oliveira, Fernando Paulino de
author_facet Oliveira, Fernando Paulino de
author_role author
dc.contributor.advisor1.fl_str_mv Fromm, Guilherme
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6627254642763875
dc.contributor.referee1.fl_str_mv Silva, Igor
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/6440150670404908
dc.contributor.referee2.fl_str_mv Tagnin, Stella
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/4402771732265181
dc.contributor.referee3.fl_str_mv Novodvorski, Ariel
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/2882362453894798
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7359501221998166
dc.contributor.author.fl_str_mv Oliveira, Fernando Paulino de
contributor_str_mv Fromm, Guilherme
Silva, Igor
Tagnin, Stella
Novodvorski, Ariel
dc.subject.cnpq.fl_str_mv CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA
topic CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA
Linguística de corpus
Construção manual de corpus
CoCLI
Métricas de medição de esforço
ToGatherUp
Linguística
Língua inglesa - Computação
Corpus Linguistics
Manual construction of corpus
Effort measurement metrics
dc.subject.por.fl_str_mv Linguística de corpus
Construção manual de corpus
CoCLI
Métricas de medição de esforço
ToGatherUp
Linguística
Língua inglesa - Computação
Corpus Linguistics
Manual construction of corpus
Effort measurement metrics
description Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-06-19T15:30:02Z
dc.date.available.fl_str_mv 2019-06-19T15:30:02Z
dc.date.issued.fl_str_mv 2019-05-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: http://dx.doi.org/10.14393/ufu.di.2019.679.
dc.identifier.uri.fl_str_mv https://repositorio.ufu.br/handle/123456789/25433
dc.identifier.doi.pt_BR.fl_str_mv http://dx.doi.org/10.14393/ufu.di.2019.679
identifier_str_mv OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: http://dx.doi.org/10.14393/ufu.di.2019.679.
url https://repositorio.ufu.br/handle/123456789/25433
http://dx.doi.org/10.14393/ufu.di.2019.679
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/publicdomain/zero/1.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/publicdomain/zero/1.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Estudos Linguísticos
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Uberlândia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
bitstream.url.fl_str_mv https://repositorio.ufu.br/bitstream/123456789/25433/1/ToGatherUpProt%c3%b3tipoFerramenta
https://repositorio.ufu.br/bitstream/123456789/25433/2/license_rdf
https://repositorio.ufu.br/bitstream/123456789/25433/3/license.txt
https://repositorio.ufu.br/bitstream/123456789/25433/4/ToGatherUpProt%c3%b3tipoFerramenta.txt
https://repositorio.ufu.br/bitstream/123456789/25433/5/ToGatherUpProt%c3%b3tipoFerramenta.jpg
bitstream.checksum.fl_str_mv 311ae5c544a9488aa929876fbaf746ae
42fd4ad1e89814f5e4a476b409eb708c
48ded82ce41b8d2426af12aed6b3cbf3
30ef2cfc3c7593f491fa688501d1d1c5
0e83a78cb05af4e636cc14ab69d2d803
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1797425611775410176