ToGatherUp: um protótipo de ferramenta para a construção de corpora
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/25433 http://dx.doi.org/10.14393/ufu.di.2019.679 |
Resumo: | Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora. |
id |
UFU_0cbc9de0d3516931a8e9ed2426e549d3 |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/25433 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
2019-06-19T15:30:02Z2019-06-19T15:30:02Z2019-05-30OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: http://dx.doi.org/10.14393/ufu.di.2019.679.https://repositorio.ufu.br/handle/123456789/25433http://dx.doi.org/10.14393/ufu.di.2019.679Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.This research verifies the effects of incorporating the ToGatherUp tool on both time and effort for building manually the corpus presented herein: the Corpus of Computing in English (CoCLI). We have developed a set of effort measurement metrics – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The theory and methodology of Corpus Linguistics, together with the concepts from Project Management, subsidized our proposal of systematizing the manual construction of corpora and for creating the two versions of the CoCLI and, along with the notions of the Computing area, guided us in the development of ToGatherUp. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora.Dissertação (Mestrado)porUniversidade Federal de UberlândiaPrograma de Pós-graduação em Estudos LinguísticosBrasilhttp://creativecommons.org/publicdomain/zero/1.0/info:eu-repo/semantics/openAccessCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICALinguística de corpusConstrução manual de corpusCoCLIMétricas de medição de esforçoToGatherUpLinguísticaLíngua inglesa - ComputaçãoCorpus LinguisticsManual construction of corpusEffort measurement metricsToGatherUp: um protótipo de ferramenta para a construção de corporaToGatherUp: a prototype tool for building corporainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisFromm, Guilhermehttp://lattes.cnpq.br/6627254642763875Silva, Igorhttp://lattes.cnpq.br/6440150670404908Tagnin, Stellahttp://lattes.cnpq.br/4402771732265181Novodvorski, Arielhttp://lattes.cnpq.br/2882362453894798http://lattes.cnpq.br/7359501221998166Oliveira, Fernando Paulino de21958674994reponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFUORIGINALToGatherUpProtótipoFerramentaToGatherUpProtótipoFerramentaDissertação de Fernando Paulino de Oliveira.application/pdf3272353https://repositorio.ufu.br/bitstream/123456789/25433/1/ToGatherUpProt%c3%b3tipoFerramenta311ae5c544a9488aa929876fbaf746aeMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8701https://repositorio.ufu.br/bitstream/123456789/25433/2/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81792https://repositorio.ufu.br/bitstream/123456789/25433/3/license.txt48ded82ce41b8d2426af12aed6b3cbf3MD53TEXTToGatherUpProtótipoFerramenta.txtToGatherUpProtótipoFerramenta.txtExtracted texttext/plain407424https://repositorio.ufu.br/bitstream/123456789/25433/4/ToGatherUpProt%c3%b3tipoFerramenta.txt30ef2cfc3c7593f491fa688501d1d1c5MD54THUMBNAILToGatherUpProtótipoFerramenta.jpgToGatherUpProtótipoFerramenta.jpgGenerated Thumbnailimage/jpeg1221https://repositorio.ufu.br/bitstream/123456789/25433/5/ToGatherUpProt%c3%b3tipoFerramenta.jpg0e83a78cb05af4e636cc14ab69d2d803MD55123456789/254332019-06-20 03:06:29.696oai:repositorio.ufu.br:123456789/25433w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLCBhbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbm8gUmVwb3NpdMOzcmlvLiBQb3IgZmF2b3IsIGxlaWEgYSBsaWNlbsOnYSBhdGVudGFtZW50ZS4gQ2FzbyBuZWNlc3NpdGUgZGUgYWxndW0gZXNjbGFyZWNpbWVudG8gZW50cmUgZW0gY29udGF0byBhdHJhdsOpcyBkbyBlLW1haWwgIHJlcG9zaXRvcmlvQHVmdS5ici4KCkxJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBbyBhc3NpbmFyIGUgZW50cmVnYXIgZXN0YSBsaWNlbsOnYSwgby9hIFNyLi9TcmEuIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpOgoKYSkgQ29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0gZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLgoKU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldShzKSBub21lKHMpIGNvbW8gbyhzKSBhdXRvcihlcykgb3UgZGV0ZW50b3IgKGVzKSBkb3MgZGlyZWl0b3MgZG8gZG9jdW1lbnRvIGVudHJlZ3VlLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2024-04-26T15:12:50.087632Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.pt_BR.fl_str_mv |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
dc.title.alternative.pt_BR.fl_str_mv |
ToGatherUp: a prototype tool for building corpora |
title |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
spellingShingle |
ToGatherUp: um protótipo de ferramenta para a construção de corpora Oliveira, Fernando Paulino de CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA Linguística de corpus Construção manual de corpus CoCLI Métricas de medição de esforço ToGatherUp Linguística Língua inglesa - Computação Corpus Linguistics Manual construction of corpus Effort measurement metrics |
title_short |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
title_full |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
title_fullStr |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
title_full_unstemmed |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
title_sort |
ToGatherUp: um protótipo de ferramenta para a construção de corpora |
author |
Oliveira, Fernando Paulino de |
author_facet |
Oliveira, Fernando Paulino de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Fromm, Guilherme |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6627254642763875 |
dc.contributor.referee1.fl_str_mv |
Silva, Igor |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/6440150670404908 |
dc.contributor.referee2.fl_str_mv |
Tagnin, Stella |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/4402771732265181 |
dc.contributor.referee3.fl_str_mv |
Novodvorski, Ariel |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/2882362453894798 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7359501221998166 |
dc.contributor.author.fl_str_mv |
Oliveira, Fernando Paulino de |
contributor_str_mv |
Fromm, Guilherme Silva, Igor Tagnin, Stella Novodvorski, Ariel |
dc.subject.cnpq.fl_str_mv |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA |
topic |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA Linguística de corpus Construção manual de corpus CoCLI Métricas de medição de esforço ToGatherUp Linguística Língua inglesa - Computação Corpus Linguistics Manual construction of corpus Effort measurement metrics |
dc.subject.por.fl_str_mv |
Linguística de corpus Construção manual de corpus CoCLI Métricas de medição de esforço ToGatherUp Linguística Língua inglesa - Computação Corpus Linguistics Manual construction of corpus Effort measurement metrics |
description |
Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-06-19T15:30:02Z |
dc.date.available.fl_str_mv |
2019-06-19T15:30:02Z |
dc.date.issued.fl_str_mv |
2019-05-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: http://dx.doi.org/10.14393/ufu.di.2019.679. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufu.br/handle/123456789/25433 |
dc.identifier.doi.pt_BR.fl_str_mv |
http://dx.doi.org/10.14393/ufu.di.2019.679 |
identifier_str_mv |
OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: http://dx.doi.org/10.14393/ufu.di.2019.679. |
url |
https://repositorio.ufu.br/handle/123456789/25433 http://dx.doi.org/10.14393/ufu.di.2019.679 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/publicdomain/zero/1.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/publicdomain/zero/1.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Uberlândia |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Estudos Linguísticos |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Uberlândia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
bitstream.url.fl_str_mv |
https://repositorio.ufu.br/bitstream/123456789/25433/1/ToGatherUpProt%c3%b3tipoFerramenta https://repositorio.ufu.br/bitstream/123456789/25433/2/license_rdf https://repositorio.ufu.br/bitstream/123456789/25433/3/license.txt https://repositorio.ufu.br/bitstream/123456789/25433/4/ToGatherUpProt%c3%b3tipoFerramenta.txt https://repositorio.ufu.br/bitstream/123456789/25433/5/ToGatherUpProt%c3%b3tipoFerramenta.jpg |
bitstream.checksum.fl_str_mv |
311ae5c544a9488aa929876fbaf746ae 42fd4ad1e89814f5e4a476b409eb708c 48ded82ce41b8d2426af12aed6b3cbf3 30ef2cfc3c7593f491fa688501d1d1c5 0e83a78cb05af4e636cc14ab69d2d803 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1797425611775410176 |