Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Domínios de Lingu@gem |
Texto Completo: | https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/31077 |
Resumo: | Este trabalho apresenta um estudo em que técnicas de Processamento de Linguagem Natural (PLN) e de Linguística de Corpus (LC) são utilizadas para extrair e estruturar termos relacionados a conceitos importantes de Saussure no texto em português do Curso de Linguística Geral (CLG). Tomando o CLG como um corpus, busca-se um método de representação automática de conteúdo através de ferramentas computacionais. Uma vez submetido ao parser PALAVRAS, um etiquetador morfossintático para a língua portuguesa, o corpus do CLG é processado pela ferramenta extratora de sintagmas nominais relevantes, denominada ExATOlp, que implementa diversas técnicas de PLN de base linguística e de base estatística. Em seguida, são geradas listas e gráficos hierarquizados dos sintagmas nominais do CLG, elencados pela ferramenta como os mais específicos/relevantes do corpus em questão. Esses resultados são comparados com dados gerados pela ferramenta AntConc, ferramenta de acesso livre bastante empregada em trabalhos de LC, aplicada ao mesmo corpus. Os resultados mostram o potencial da ferramenta ExATOlp para trabalhos em LC e para o levantamento de dados lexicais para estudos terminológicos, para a mineração de dados e para a geração de ontologias em língua portuguesa. |
id |
UFU-12_3b8e1640f817c06e10a05b215ee93955 |
---|---|
oai_identifier_str |
oai:ojs.www.seer.ufu.br:article/31077 |
network_acronym_str |
UFU-12 |
network_name_str |
Domínios de Lingu@gem |
repository_id_str |
|
spelling |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem NaturalExtração automática de termosCurso de Linguística GeralSaussureEste trabalho apresenta um estudo em que técnicas de Processamento de Linguagem Natural (PLN) e de Linguística de Corpus (LC) são utilizadas para extrair e estruturar termos relacionados a conceitos importantes de Saussure no texto em português do Curso de Linguística Geral (CLG). Tomando o CLG como um corpus, busca-se um método de representação automática de conteúdo através de ferramentas computacionais. Uma vez submetido ao parser PALAVRAS, um etiquetador morfossintático para a língua portuguesa, o corpus do CLG é processado pela ferramenta extratora de sintagmas nominais relevantes, denominada ExATOlp, que implementa diversas técnicas de PLN de base linguística e de base estatística. Em seguida, são geradas listas e gráficos hierarquizados dos sintagmas nominais do CLG, elencados pela ferramenta como os mais específicos/relevantes do corpus em questão. Esses resultados são comparados com dados gerados pela ferramenta AntConc, ferramenta de acesso livre bastante empregada em trabalhos de LC, aplicada ao mesmo corpus. Os resultados mostram o potencial da ferramenta ExATOlp para trabalhos em LC e para o levantamento de dados lexicais para estudos terminológicos, para a mineração de dados e para a geração de ontologias em língua portuguesa.PP/UFU2015-12-18info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/3107710.14393/DL18-v9n2a2015-4Domínios de Lingu@gem; Vol. 9 No. 2 (2015): Linguística de Corpus; 40-55Domínios de Lingu@gem; Vol. 9 Núm. 2 (2015): Linguística de Corpus; 40-55Domínios de Lingu@gem; v. 9 n. 2 (2015): Linguística de Corpus; 40-551980-5799reponame:Domínios de Lingu@geminstname:Universidade Federal de Uberlândia (UFU)instacron:UFUporhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/31077/17557Copyright (c) 2015 Lucelene Lopes, Maria José Bocorny Finatto, Alena Ciullainfo:eu-repo/semantics/openAccessLopes, LuceleneFinatto, Maria José BocornyCiulla, Alena2016-07-12T18:39:22Zoai:ojs.www.seer.ufu.br:article/31077Revistahttps://seer.ufu.br/index.php/dominiosdelinguagemPUBhttps://seer.ufu.br/index.php/dominiosdelinguagem/oairevistadominios@ileel.ufu.br||1980-57991980-5799opendoar:2016-07-12T18:39:22Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
title |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
spellingShingle |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural Lopes, Lucelene Extração automática de termos Curso de Linguística Geral Saussure |
title_short |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
title_full |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
title_fullStr |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
title_full_unstemmed |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
title_sort |
Extração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da Linguística de Corpus e do Processamento de Linguagem Natural |
author |
Lopes, Lucelene |
author_facet |
Lopes, Lucelene Finatto, Maria José Bocorny Ciulla, Alena |
author_role |
author |
author2 |
Finatto, Maria José Bocorny Ciulla, Alena |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Lopes, Lucelene Finatto, Maria José Bocorny Ciulla, Alena |
dc.subject.por.fl_str_mv |
Extração automática de termos Curso de Linguística Geral Saussure |
topic |
Extração automática de termos Curso de Linguística Geral Saussure |
description |
Este trabalho apresenta um estudo em que técnicas de Processamento de Linguagem Natural (PLN) e de Linguística de Corpus (LC) são utilizadas para extrair e estruturar termos relacionados a conceitos importantes de Saussure no texto em português do Curso de Linguística Geral (CLG). Tomando o CLG como um corpus, busca-se um método de representação automática de conteúdo através de ferramentas computacionais. Uma vez submetido ao parser PALAVRAS, um etiquetador morfossintático para a língua portuguesa, o corpus do CLG é processado pela ferramenta extratora de sintagmas nominais relevantes, denominada ExATOlp, que implementa diversas técnicas de PLN de base linguística e de base estatística. Em seguida, são geradas listas e gráficos hierarquizados dos sintagmas nominais do CLG, elencados pela ferramenta como os mais específicos/relevantes do corpus em questão. Esses resultados são comparados com dados gerados pela ferramenta AntConc, ferramenta de acesso livre bastante empregada em trabalhos de LC, aplicada ao mesmo corpus. Os resultados mostram o potencial da ferramenta ExATOlp para trabalhos em LC e para o levantamento de dados lexicais para estudos terminológicos, para a mineração de dados e para a geração de ontologias em língua portuguesa. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-12-18 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/31077 10.14393/DL18-v9n2a2015-4 |
url |
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/31077 |
identifier_str_mv |
10.14393/DL18-v9n2a2015-4 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/31077/17557 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2015 Lucelene Lopes, Maria José Bocorny Finatto, Alena Ciulla info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2015 Lucelene Lopes, Maria José Bocorny Finatto, Alena Ciulla |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
PP/UFU |
publisher.none.fl_str_mv |
PP/UFU |
dc.source.none.fl_str_mv |
Domínios de Lingu@gem; Vol. 9 No. 2 (2015): Linguística de Corpus; 40-55 Domínios de Lingu@gem; Vol. 9 Núm. 2 (2015): Linguística de Corpus; 40-55 Domínios de Lingu@gem; v. 9 n. 2 (2015): Linguística de Corpus; 40-55 1980-5799 reponame:Domínios de Lingu@gem instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Domínios de Lingu@gem |
collection |
Domínios de Lingu@gem |
repository.name.fl_str_mv |
Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
revistadominios@ileel.ufu.br|| |
_version_ |
1797067714797240320 |