Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos

Detalhes bibliográficos
Autor(a) principal: Peixoto, Lucas Maciel
Data de Publicação: 2015
Outros Autores: Afra Brito, Luiz Fernando
Tipo de documento: Artigo
Idioma: por
Título da fonte: Domínios de Lingu@gem
Texto Completo: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266
Resumo: O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.
id UFU-12_1eb48821b84b17c07850735db68cafa2
oai_identifier_str oai:ojs.www.seer.ufu.br:article/29266
network_acronym_str UFU-12
network_name_str Domínios de Lingu@gem
repository_id_str
spelling Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language VideosLinguística ComputacionalLinguística de CorpusEnsino de línguas baseado em corporaCompilação de corpusFerramentas de corpora on-lineO Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.PP/UFU2015-07-31info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/2926610.14393/DL19-v9n3a2015-15Domínios de Lingu@gem; Vol. 9 No. 3 (2015): Número atemático; 275-299Domínios de Lingu@gem; Vol. 9 Núm. 3 (2015): Número atemático; 275-299Domínios de Lingu@gem; v. 9 n. 3 (2015): Número atemático; 275-2991980-5799reponame:Domínios de Lingu@geminstname:Universidade Federal de Uberlândia (UFU)instacron:UFUporhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266/16982Copyright (c) 2015 Lucas Maciel Peixoto, Luiz Fernando Afra Britoinfo:eu-repo/semantics/openAccessPeixoto, Lucas MacielAfra Brito, Luiz Fernando2016-07-12T18:39:58Zoai:ojs.www.seer.ufu.br:article/29266Revistahttps://seer.ufu.br/index.php/dominiosdelinguagemPUBhttps://seer.ufu.br/index.php/dominiosdelinguagem/oairevistadominios@ileel.ufu.br||1980-57991980-5799opendoar:2016-07-12T18:39:58Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
spellingShingle Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
Peixoto, Lucas Maciel
Linguística Computacional
Linguística de Corpus
Ensino de línguas baseado em corpora
Compilação de corpus
Ferramentas de corpora on-line
title_short Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_full Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_fullStr Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_full_unstemmed Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_sort Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
author Peixoto, Lucas Maciel
author_facet Peixoto, Lucas Maciel
Afra Brito, Luiz Fernando
author_role author
author2 Afra Brito, Luiz Fernando
author2_role author
dc.contributor.author.fl_str_mv Peixoto, Lucas Maciel
Afra Brito, Luiz Fernando
dc.subject.por.fl_str_mv Linguística Computacional
Linguística de Corpus
Ensino de línguas baseado em corpora
Compilação de corpus
Ferramentas de corpora on-line
topic Linguística Computacional
Linguística de Corpus
Ensino de línguas baseado em corpora
Compilação de corpus
Ferramentas de corpora on-line
description O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.
publishDate 2015
dc.date.none.fl_str_mv 2015-07-31
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266
10.14393/DL19-v9n3a2015-15
url https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266
identifier_str_mv 10.14393/DL19-v9n3a2015-15
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266/16982
dc.rights.driver.fl_str_mv Copyright (c) 2015 Lucas Maciel Peixoto, Luiz Fernando Afra Brito
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2015 Lucas Maciel Peixoto, Luiz Fernando Afra Brito
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv PP/UFU
publisher.none.fl_str_mv PP/UFU
dc.source.none.fl_str_mv Domínios de Lingu@gem; Vol. 9 No. 3 (2015): Número atemático; 275-299
Domínios de Lingu@gem; Vol. 9 Núm. 3 (2015): Número atemático; 275-299
Domínios de Lingu@gem; v. 9 n. 3 (2015): Número atemático; 275-299
1980-5799
reponame:Domínios de Lingu@gem
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Domínios de Lingu@gem
collection Domínios de Lingu@gem
repository.name.fl_str_mv Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv revistadominios@ileel.ufu.br||
_version_ 1797067714781511680