Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas

Detalhes bibliográficos
Autor(a) principal: Bartholamei Junior, Lautenai Antonio
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/130892
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Estudos da Tradução, Florianópolis, 2013.
id UFSC_22191d0f276f25336f6617c0067cba03
oai_identifier_str oai:repositorio.ufsc.br:123456789/130892
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicasTradução e interpretaçãoLinguistica -Processamento de dadosTradução mecânicaCiências médicasTerminologiaTese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Estudos da Tradução, Florianópolis, 2013.A extração terminológica bilíngue cada vez mais se firma como um campo de pesquisa explorado por pesquisadores no âmbito dos Estudos da Tradução. Parte considerável das investigações atualmente desenvolvidas volta-se à operacionalização das tarefas de extração terminológica por meio de ferramentas computacionais, produzindo glossários para servirem como ferramenta de apoio aos tradutores. Esta pesquisa de doutoramento desenvolve uma proposta sequencial para a extração terminológica na área das Ciências Médicas, centrando-se principalmente em uma lacuna detectada em estudos anteriores, a saber: a busca por correspondentes tradutórios dos candidatos a termos, geralmente realizada, de forma manual. Nesta perspectiva, o estudo emprega ferramentas fornecidas pelo Processamento da Linguagem Natural (PLN), evocando principalmente as seguintes disciplinas: Linguística de Corpus, Corpora nos Estudos da Tradução, Terminologia e Extração Terminológica, com o intuito de oferecer um processo sistemático que contemple o processo de extração terminológica. Na presente proposta, os dados obtidos evidenciam altos níveis de precisão, que levam a supor que por meio da referida abordagem a recuperação de candidatos a termos e a busca por seus correspondentes tradutórios pode efetivamente ser otimizadas, revelando-se tão eficiente quanto a extração terminológica realizada analogicamente por especialistas. Em uma escala numérica de 0 (zero) a 1 (um), a probabilidade de 0,822645962, 0.969518 e, em alguns casos, 1 (um), explicita a precisão dos correspondentes tradutórios. Os resultados ainda demonstraram que, embora os corpora utilizados para análise estejam expostos em português europeu, e circunscritos uma área especifica do conhecimento, os valores semânticos dos correspondentes tradutórios foram mantido. Na proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos, a ordem sequencial proposta, tal como os sistemas informáticos desenvolvidos para o processamento dos dados tratam do par de idiomas inglês-português, no entanto, poderão ser utilizados outros pares de línguas e corpora de outros campos do conhecimento.<br>Abstract : Bilingual terminology extraction increasingly firm as a field of research explored by scholars in the context of Translation Studies. Considerable part of the researches currently carried back to the operationalization of terminology extraction tasks by using computational tools, producing glossaries to serve as a support tool for translators. The research developed in this PhD dissertation aims to develop a sequential proposal for terminology extraction in the field of Medical Sciences focusing mainly on a gap detected in previous studies, viz., searching for matching translation equivalents for terms candidates generally heldmanually. In this perspective, the study uses tools provided by Natural Language Processing (NLP), mostly evoking the following disciplines: Corpus Linguistics, Corpora in Translation Studies, Terminology and Terminology Extraction, in order to offer a systematic process that addresses the terminology extraction task. In the proposal, data gathered presented high levels of accuracy, leading us to believe that through this approach for retrieval of translation equivalents for the terms candidates can be optimized effectively, preserving as efficient in terminology extraction as performed by specialists. In a numerical scale from 0 (zero) to 1 (one), probabilities as in 0.822645962 , 0.969518 , and in some cases 1 (one) explicit translation equivalents retrieval accuracy. The results also showed that, although the corpora used for analysis are exposed in European Portuguese, and circumscribed a specific area of knowledge, the semantic value of the translation equivalents was maintained. In the sequential order proposal and creation of systems for bilingual terminology extraction in parallel corpora , the sequential order proposed, as well the computational systems developed for data processing dealing with the English-Portuguese language pair, however, it cloud be used to other languages pairs and corpora to other fields of knowledge.Lima, RonaldoDurand, Alain-PhilippeUniversidade Federal de Santa CatarinaBartholamei Junior, Lautenai Antonio2015-03-18T20:50:24Z2015-03-18T20:50:24Z2013info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis200 p.| il., grafs., tabs.application/pdf328193https://repositorio.ufsc.br/xmlui/handle/123456789/130892porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2015-03-18T20:50:24Zoai:repositorio.ufsc.br:123456789/130892Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732015-03-18T20:50:24Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
title Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
spellingShingle Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
Bartholamei Junior, Lautenai Antonio
Tradução e interpretação
Linguistica -
Processamento de dados
Tradução mecânica
Ciências médicas
Terminologia
title_short Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
title_full Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
title_fullStr Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
title_full_unstemmed Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
title_sort Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas
author Bartholamei Junior, Lautenai Antonio
author_facet Bartholamei Junior, Lautenai Antonio
author_role author
dc.contributor.none.fl_str_mv Lima, Ronaldo
Durand, Alain-Philippe
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Bartholamei Junior, Lautenai Antonio
dc.subject.por.fl_str_mv Tradução e interpretação
Linguistica -
Processamento de dados
Tradução mecânica
Ciências médicas
Terminologia
topic Tradução e interpretação
Linguistica -
Processamento de dados
Tradução mecânica
Ciências médicas
Terminologia
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Estudos da Tradução, Florianópolis, 2013.
publishDate 2013
dc.date.none.fl_str_mv 2013
2015-03-18T20:50:24Z
2015-03-18T20:50:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 328193
https://repositorio.ufsc.br/xmlui/handle/123456789/130892
identifier_str_mv 328193
url https://repositorio.ufsc.br/xmlui/handle/123456789/130892
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 200 p.| il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651952287907840