Mitigando viés de gênero na tradução automática para o português

Detalhes bibliográficos
Autor(a) principal: Rabonato, Ricardo Trainotti [UNIFESP]
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNIFESP
Texto Completo: https://hdl.handle.net/11600/70983
Resumo: A Tradução Automática (TA) tornou-se uma ferramenta essencial na era da globalização, facilitando a comunicação e o acesso à informação em diversas línguas. No entanto, a presença de viés em modelos de TA representa um desafio significativo, especialmente em línguas menos populares como o Português. Um dos desafios está relacionado à presença de viés de gênero na tradução, em que estereótipos e desigualdades sociais podem ser inadvertidamente perpetuados. Esta pesquisa se concentra em abordar e mitigar o viés de gênero em modelos de TA do Inglês para o Português, uma área ainda pouco explorada em comparação com outros pares de línguas. O foco era desenvolver uma metodologia que preservasse a precisão das traduções, ao mesmo tempo em que promovia a equidade de gênero nos textos gerados. Para isso, a estratégia adotada foi a de aplicar técnicas de ajuste fino (fine-tuning) em um modelo de TA pré-treinado, visando otimizar os parâmetros do modelo para alcançar traduções precisas e reduzir o viés de gênero. A pesquisa desenvolveu um processo de ajuste fino focado na redução do viés, que inclui a criação de um corpus paralelo Inglês-Português equilibrado em relação à representação estereotipada / não estereotipada de gênero. Foi utilizado o modelo de TA pré-treinado MarianMT como base, o qual foi ajustado utilizando um conjunto de dados específico, visando mitigar o viés de gênero nas traduções do Inglês para o Português, sem comprometer demasiadamente a qualidade do modelo original. Os resultados, medidos com base no conjunto de testes WinoMT, determinados pelos indicadores ∆G, ∆S e a acurácia global (preservação do gênero da entidade principal do original), mostraram uma melhoria significativa na equidade de gênero após o emprego do fine-tuning, embora com uma ligeira redução na qualidade da tradução, verificada pela pontuação BLEU (BiLingual Evaluation Understudy). Este estudo não só demonstra a eficácia do fine-tuning para atenuar o viés de gênero em traduções do Inglês para o Português, mas também contribui para a compreensão mais ampla de como abordar este desafio e abre caminhos para futuras pesquisas na área, ressaltando a importância de criar sistemas de inteligência artificial mais inclusivos e eticamente responsáveis.
id UFSP_d833e06ae72d514aff501a72f3d204cc
oai_identifier_str oai:repositorio.unifesp.br/:11600/70983
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str 3465
spelling http://lattes.cnpq.br/9064767888093340Rabonato, Ricardo Trainotti [UNIFESP]http://lattes.cnpq.br/8475909935036978Berton, Lilian [UNIFESP]São José dos Campos, SP2024-04-10T16:10:05Z2024-04-10T16:10:05Z2024-02-26A Tradução Automática (TA) tornou-se uma ferramenta essencial na era da globalização, facilitando a comunicação e o acesso à informação em diversas línguas. No entanto, a presença de viés em modelos de TA representa um desafio significativo, especialmente em línguas menos populares como o Português. Um dos desafios está relacionado à presença de viés de gênero na tradução, em que estereótipos e desigualdades sociais podem ser inadvertidamente perpetuados. Esta pesquisa se concentra em abordar e mitigar o viés de gênero em modelos de TA do Inglês para o Português, uma área ainda pouco explorada em comparação com outros pares de línguas. O foco era desenvolver uma metodologia que preservasse a precisão das traduções, ao mesmo tempo em que promovia a equidade de gênero nos textos gerados. Para isso, a estratégia adotada foi a de aplicar técnicas de ajuste fino (fine-tuning) em um modelo de TA pré-treinado, visando otimizar os parâmetros do modelo para alcançar traduções precisas e reduzir o viés de gênero. A pesquisa desenvolveu um processo de ajuste fino focado na redução do viés, que inclui a criação de um corpus paralelo Inglês-Português equilibrado em relação à representação estereotipada / não estereotipada de gênero. Foi utilizado o modelo de TA pré-treinado MarianMT como base, o qual foi ajustado utilizando um conjunto de dados específico, visando mitigar o viés de gênero nas traduções do Inglês para o Português, sem comprometer demasiadamente a qualidade do modelo original. Os resultados, medidos com base no conjunto de testes WinoMT, determinados pelos indicadores ∆G, ∆S e a acurácia global (preservação do gênero da entidade principal do original), mostraram uma melhoria significativa na equidade de gênero após o emprego do fine-tuning, embora com uma ligeira redução na qualidade da tradução, verificada pela pontuação BLEU (BiLingual Evaluation Understudy). Este estudo não só demonstra a eficácia do fine-tuning para atenuar o viés de gênero em traduções do Inglês para o Português, mas também contribui para a compreensão mais ampla de como abordar este desafio e abre caminhos para futuras pesquisas na área, ressaltando a importância de criar sistemas de inteligência artificial mais inclusivos e eticamente responsáveis.Não recebi financiamentolberton@unifesp.br102 f.https://hdl.handle.net/11600/70983porUniversidade Federal de São PauloTradução AutomáticaViés de GêneroProcessamento de Linguagem NaturalFine-TuningEquidadeMitigando viés de gênero na tradução automática para o portuguêsMitigating gender bias in machine translation to portugueseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPInstituto de Ciência e Tecnologia (ICT)30328529869Ciência da ComputaçãoCiência da ComputaçãoSistemas InteligentesORIGINALmitigandoViesdeGeneroPDFA.pdfmitigandoViesdeGeneroPDFA.pdfapplication/pdf1473565https://repositorio.unifesp.br/bitstreams/c2370846-df79-489f-baeb-dbc99a02a244/download55565f8c19615e97698736bd0a939a05MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-85679https://repositorio.unifesp.br/bitstreams/73e9c82e-9dae-4147-b91e-c6a8a40dfa17/download859ba7aac438f424e54bd364c2aecf3cMD52TEXTmitigandoViesdeGeneroPDFA.pdf.txtmitigandoViesdeGeneroPDFA.pdf.txtExtracted texttext/plain103605https://repositorio.unifesp.br/bitstreams/83ded2f0-e031-4052-8e26-c088f58b7da1/download493f8f0851642d6717dd67e36ee8cdb1MD54THUMBNAILmitigandoViesdeGeneroPDFA.pdf.jpgmitigandoViesdeGeneroPDFA.pdf.jpgGenerated Thumbnailimage/jpeg3839https://repositorio.unifesp.br/bitstreams/b0899d98-93cf-4012-97d1-7a15cc41d091/downloadbfc441d6680b040acd66ccfeb95f7c6aMD5511600/709832024-04-11 15:12:31.73oai:repositorio.unifesp.br/:11600/70983https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestopendoar:34652024-04-11T15:12:31Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)falseClRFUk1PUyBFIENPTkRJw4fDlUVTIFBBUkEgTyBMSUNFTkNJQU1FTlRPIERPIEFSUVVJVkFNRU5UTywgUkVQUk9EVcOHw4NPIEUgRElWVUxHQcOHw4NPIFDDmkJMSUNBIERFIENPTlRFw5pETyBOTyBSRVBPU0lUw5NSSU8gSU5TVElUVUNJT05BTCBVTklGRVNQIDxicj48YnI+CgoxLiBEZWNsYXJvLW1lIHJlc3BvbnPDoXZlbCBwZWxvIHRyYWJhbGhvICBlL291IHVzdcOhcmlvLWRlcG9zaXRhbnRlIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIFVOSUZFU1AsYXNzZWd1cm8gbm8gcHJlc2VudGUgYXRvIHF1ZSBzb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGF0cmltb25pYWlzIGUvb3UgZGlyZWl0b3MgY29uZXhvcyByZWZlcmVudGVzIMOgIHRvdGFsaWRhZGUgZGEgT2JyYSBvcmEgZGVwb3NpdGFkYSBlbSBmb3JtYXRvIGRpZ2l0YWwsIGJlbSBjb21vIGRlIHNldXMgY29tcG9uZW50ZXMgbWVub3JlcywgZW0gc2UgdHJhdGFuZG8gZGUgb2JyYSBjb2xldGl2YSwgY29uZm9ybWUgbyBwcmVjZWl0dWFkbyBwZWxhIExlaSA5LjYxMC85OCBlL291IExlaSA5LjYwOS85OC4gTsOjbyBzZW5kbyBlc3RlIG8gY2FzbywgYXNzZWd1cm8gdGVyIG9idGlkbyBkaXJldGFtZW50ZSBkb3MgZGV2aWRvcyB0aXR1bGFyZXMgYXV0b3JpemHDp8OjbyBwcsOpdmlhIGUgZXhwcmVzc2EgcGFyYSBvIGRlcMOzc2l0byBlIHBhcmEgYSBkaXZ1bGdhw6fDo28gZGEgT2JyYSwgYWJyYW5nZW5kbyB0b2RvcyBvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmV4b3MgYWZldGFkb3MgcGVsYSBhc3NpbmF0dXJhIGRvIHByZXNlbnRlIHRlcm1vIGRlIGxpY2VuY2lhbWVudG8sIGRlIG1vZG8gYSBlZmV0aXZhbWVudGUgaXNlbnRhciBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApIGUgc2V1cyBmdW5jaW9uw6FyaW9zIGRlIHF1YWxxdWVyIHJlc3BvbnNhYmlsaWRhZGUgcGVsbyB1c28gbsOjby1hdXRvcml6YWRvIGRvIG1hdGVyaWFsIGRlcG9zaXRhZG8sIHNlamEgZW0gdmluY3VsYcOnw6NvIGFvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIFVOSUZFU1AsIHNlamEgZW0gdmluY3VsYcOnw6NvIGEgcXVhaXNxdWVyIHNlcnZpw6dvcyBkZSBidXNjYSBlIGRlIGRpc3RyaWJ1acOnw6NvIGRlIGNvbnRlw7pkbyBxdWUgZmHDp2FtIHVzbyBkYXMgaW50ZXJmYWNlcyBlIGVzcGHDp28gZGUgYXJtYXplbmFtZW50byBwcm92aWRlbmNpYWRvcyBwZWxhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApIHBvciBtZWlvIGRlIHNldXMgc2lzdGVtYXMgaW5mb3JtYXRpemFkb3MuCgoyLiBBIGNvbmNvcmTDom5jaWEgY29tIGVzdGEgbGljZW7Dp2EgdGVtIGNvbW8gY29uc2VxdcOqbmNpYSBhIHRyYW5zZmVyw6puY2lhLCBhIHTDrXR1bG8gbsOjby1leGNsdXNpdm8gZSBuw6NvLW9uZXJvc28sIGlzZW50YSBkbyBwYWdhbWVudG8gZGUgcm95YWx0aWVzIG91IHF1YWxxdWVyIG91dHJhIGNvbnRyYXByZXN0YcOnw6NvLCBwZWN1bmnDoXJpYSBvdSBuw6NvLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBkb3MgZGlyZWl0b3MgZGUgYXJtYXplbmFyIGRpZ2l0YWxtZW50ZSwgZGUgcmVwcm9kdXppciBlIGRlIGRpc3RyaWJ1aXIgbmFjaW9uYWwgZSBpbnRlcm5hY2lvbmFsbWVudGUgYSBPYnJhLCBpbmNsdWluZG8tc2UgbyBzZXUgcmVzdW1vL2Fic3RyYWN0LCBwb3IgbWVpb3MgZWxldHLDtG5pY29zIGFvIHDDumJsaWNvIGVtIGdlcmFsLCBlbSByZWdpbWUgZGUgYWNlc3NvIGFiZXJ0by4KCjMuIEEgcHJlc2VudGUgbGljZW7Dp2EgdGFtYsOpbSBhYnJhbmdlLCBub3MgbWVzbW9zIHRlcm1vcyBlc3RhYmVsZWNpZG9zIG5vIGl0ZW0gMiwgc3VwcmEsIHF1YWxxdWVyIGRpcmVpdG8gZGUgY29tdW5pY2HDp8OjbyBhbyBww7pibGljbyBjYWLDrXZlbCBlbSByZWxhw6fDo28gw6AgT2JyYSBvcmEgZGVwb3NpdGFkYSwgaW5jbHVpbmRvLXNlIG9zIHVzb3MgcmVmZXJlbnRlcyDDoCByZXByZXNlbnRhw6fDo28gcMO6YmxpY2EgZS9vdSBleGVjdcOnw6NvIHDDumJsaWNhLCBiZW0gY29tbyBxdWFscXVlciBvdXRyYSBtb2RhbGlkYWRlIGRlIGNvbXVuaWNhw6fDo28gYW8gcMO6YmxpY28gcXVlIGV4aXN0YSBvdSB2ZW5oYSBhIGV4aXN0aXIsIG5vcyB0ZXJtb3MgZG8gYXJ0aWdvIDY4IGUgc2VndWludGVzIGRhIExlaSA5LjYxMC85OCwgbmEgZXh0ZW5zw6NvIHF1ZSBmb3IgYXBsaWPDoXZlbCBhb3Mgc2VydmnDp29zIHByZXN0YWRvcyBhbyBww7pibGljbyBwZWxhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApLgoKNC4gRXN0YSBsaWNlbsOnYSBhYnJhbmdlLCBhaW5kYSwgbm9zIG1lc21vcyB0ZXJtb3MgZXN0YWJlbGVjaWRvcyBubyBpdGVtIDIsIHN1cHJhLCB0b2RvcyBvcyBkaXJlaXRvcyBjb25leG9zIGRlIGFydGlzdGFzIGludMOpcnByZXRlcyBvdSBleGVjdXRhbnRlcywgcHJvZHV0b3JlcyBmb25vZ3LDoWZpY29zIG91IGVtcHJlc2FzIGRlIHJhZGlvZGlmdXPDo28gcXVlIGV2ZW50dWFsbWVudGUgc2VqYW0gYXBsaWPDoXZlaXMgZW0gcmVsYcOnw6NvIMOgIG9icmEgZGVwb3NpdGFkYSwgZW0gY29uZm9ybWlkYWRlIGNvbSBvIHJlZ2ltZSBmaXhhZG8gbm8gVMOtdHVsbyBWIGRhIExlaSA5LjYxMC85OC4KCjUuIFNlIGEgT2JyYSBkZXBvc2l0YWRhIGZvaSBvdSDDqSBvYmpldG8gZGUgZmluYW5jaWFtZW50byBwb3IgaW5zdGl0dWnDp8O1ZXMgZGUgZm9tZW50byDDoCBwZXNxdWlzYSBvdSBxdWFscXVlciBvdXRyYSBzZW1lbGhhbnRlLCB2b2PDqiBvdSBvIHRpdHVsYXIgYXNzZWd1cmEgcXVlIGN1bXByaXUgdG9kYXMgYXMgb2JyaWdhw6fDtWVzIHF1ZSBsaGUgZm9yYW0gaW1wb3N0YXMgcGVsYSBpbnN0aXR1acOnw6NvIGZpbmFuY2lhZG9yYSBlbSByYXrDo28gZG8gZmluYW5jaWFtZW50bywgZSBxdWUgbsOjbyBlc3TDoSBjb250cmFyaWFuZG8gcXVhbHF1ZXIgZGlzcG9zacOnw6NvIGNvbnRyYXR1YWwgcmVmZXJlbnRlIMOgIHB1YmxpY2HDp8OjbyBkbyBjb250ZcO6ZG8gb3JhIHN1Ym1ldGlkbyBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQLgogCjYuIEF1dG9yaXphIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU8OjbyBQYXVsbyBhIGRpc3BvbmliaWxpemFyIGEgb2JyYSBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQIGRlIGZvcm1hIGdyYXR1aXRhLCBkZSBhY29yZG8gY29tIGEgbGljZW7Dp2EgcMO6YmxpY2EgQ3JlYXRpdmUgQ29tbW9uczogQXRyaWJ1acOnw6NvLVNlbSBEZXJpdmHDp8O1ZXMtU2VtIERlcml2YWRvcyA0LjAgSW50ZXJuYWNpb25hbCAoQ0MgQlktTkMtTkQpLCBwZXJtaXRpbmRvIHNldSBsaXZyZSBhY2Vzc28sIHVzbyBlIGNvbXBhcnRpbGhhbWVudG8sIGRlc2RlIHF1ZSBjaXRhZGEgYSBmb250ZS4gQSBvYnJhIGNvbnRpbnVhIHByb3RlZ2lkYSBwb3IgRGlyZWl0b3MgQXV0b3JhaXMgZS9vdSBwb3Igb3V0cmFzIGxlaXMgYXBsaWPDoXZlaXMuIFF1YWxxdWVyIHVzbyBkYSBvYnJhLCBxdWUgbsOjbyBvIGF1dG9yaXphZG8gc29iIGVzdGEgbGljZW7Dp2Egb3UgcGVsYSBsZWdpc2xhw6fDo28gYXV0b3JhbCwgw6kgcHJvaWJpZG8uICAKCjcuIEF0ZXN0YSBxdWUgYSBPYnJhIHN1Ym1ldGlkYSBuw6NvIGNvbnTDqW0gcXVhbHF1ZXIgaW5mb3JtYcOnw6NvIGNvbmZpZGVuY2lhbCBzdWEgb3UgZGUgdGVyY2Vpcm9zLgoKOC4gQXRlc3RhIHF1ZSBvIHRyYWJhbGhvIHN1Ym1ldGlkbyDDqSBvcmlnaW5hbCBlIGZvaSBlbGFib3JhZG8gcmVzcGVpdGFuZG8gb3MgcHJpbmPDrXBpb3MgZGEgbW9yYWwgZSBkYSDDqXRpY2EgZSBuw6NvIHZpb2xvdSBxdWFscXVlciBkaXJlaXRvIGRlIHByb3ByaWVkYWRlIGludGVsZWN0dWFsLCBzb2IgcGVuYSBkZSByZXNwb25kZXIgY2l2aWwsIGNyaW1pbmFsLCDDqXRpY2EgZSBwcm9maXNzaW9uYWxtZW50ZSBwb3IgbWV1cyBhdG9zOwoKOS4gQXRlc3RhIHF1ZSBhIHZlcnPDo28gZG8gdHJhYmFsaG8gcHJlc2VudGUgbm8gYXJxdWl2byBzdWJtZXRpZG8gw6kgYSB2ZXJzw6NvIGRlZmluaXRpdmEgcXVlIGluY2x1aSBhcyBhbHRlcmHDp8O1ZXMgZGVjb3JyZW50ZXMgZGEgZGVmZXNhLCBzb2xpY2l0YWRhcyBwZWxhIGJhbmNhLCBzZSBob3V2ZSBhbGd1bWEsIG91IHNvbGljaXRhZGFzIHBvciBwYXJ0ZSBkZSBvcmllbnRhw6fDo28gZG9jZW50ZSByZXNwb25zw6F2ZWw7CgoxMC4gQ29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgcmVhbGl6YXIgcXVhaXNxdWVyIGFsdGVyYcOnw7VlcyBuYSBtw61kaWEgb3Ugbm8gZm9ybWF0byBkbyBhcnF1aXZvIHBhcmEgcHJvcMOzc2l0b3MgZGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLCBkZSBhY2Vzc2liaWxpZGFkZSBlIGRlIG1lbGhvciBpZGVudGlmaWNhw6fDo28gZG8gdHJhYmFsaG8gc3VibWV0aWRvLCBkZXNkZSBxdWUgbsOjbyBzZWphIGFsdGVyYWRvIHNldSBjb250ZcO6ZG8gaW50ZWxlY3R1YWwuCgpBbyBjb25jbHVpciBhcyBldGFwYXMgZG8gcHJvY2Vzc28gZGUgc3VibWlzc8OjbyBkZSBhcnF1aXZvcyBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQLCBhdGVzdG8gcXVlIGxpIGUgY29uY29yZGVpIGludGVncmFsbWVudGUgY29tIG9zIHRlcm1vcyBhY2ltYSBkZWxpbWl0YWRvcywgc2VtIGZhemVyIHF1YWxxdWVyIHJlc2VydmEgZSBub3ZhbWVudGUgY29uZmlybWFuZG8gcXVlIGN1bXBybyBvcyByZXF1aXNpdG9zIGluZGljYWRvcyBub3MgaXRlbnMgbWVuY2lvbmFkb3MgYW50ZXJpb3JtZW50ZS4KCkhhdmVuZG8gcXVhbHF1ZXIgZGlzY29yZMOibmNpYSBlbSByZWxhw6fDo28gYSBwcmVzZW50ZSBsaWNlbsOnYSBvdSBuw6NvIHNlIHZlcmlmaWNhbmRvIG8gZXhpZ2lkbyBub3MgaXRlbnMgYW50ZXJpb3Jlcywgdm9jw6ogZGV2ZSBpbnRlcnJvbXBlciBpbWVkaWF0YW1lbnRlIG8gcHJvY2Vzc28gZGUgc3VibWlzc8Ojby4gQSBjb250aW51aWRhZGUgZG8gcHJvY2Vzc28gZXF1aXZhbGUgw6AgY29uY29yZMOibmNpYSBlIMOgIGFzc2luYXR1cmEgZGVzdGUgZG9jdW1lbnRvLCBjb20gdG9kYXMgYXMgY29uc2VxdcOqbmNpYXMgbmVsZSBwcmV2aXN0YXMsIHN1amVpdGFuZG8tc2UgbyBzaWduYXTDoXJpbyBhIHNhbsOnw7VlcyBjaXZpcyBlIGNyaW1pbmFpcyBjYXNvIG7Do28gc2VqYSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXRyaW1vbmlhaXMgZS9vdSBjb25leG9zIGFwbGljw6F2ZWlzIMOgIE9icmEgZGVwb3NpdGFkYSBkdXJhbnRlIGVzdGUgcHJvY2Vzc28sIG91IGNhc28gbsOjbyB0ZW5oYSBvYnRpZG8gcHLDqXZpYSBlIGV4cHJlc3NhIGF1dG9yaXphw6fDo28gZG8gdGl0dWxhciBwYXJhIG8gZGVww7NzaXRvIGUgdG9kb3Mgb3MgdXNvcyBkYSBPYnJhIGVudm9sdmlkb3MuCgpTZSB0aXZlciBxdWFscXVlciBkw7p2aWRhIHF1YW50byBhb3MgdGVybW9zIGRlIGxpY2VuY2lhbWVudG8gZSBxdWFudG8gYW8gcHJvY2Vzc28gZGUgc3VibWlzc8OjbywgZW50cmUgZW0gY29udGF0byBjb20gYSBiaWJsaW90ZWNhIGRvIHNldSBjYW1wdXMgKGNvbnN1bHRlIGVtOiBodHRwczovL2JpYmxpb3RlY2FzLnVuaWZlc3AuYnIvYmlibGlvdGVjYXMtZGEtcmVkZSkuIAoK
dc.title.none.fl_str_mv Mitigando viés de gênero na tradução automática para o português
dc.title.alternative.none.fl_str_mv Mitigating gender bias in machine translation to portuguese
title Mitigando viés de gênero na tradução automática para o português
spellingShingle Mitigando viés de gênero na tradução automática para o português
Rabonato, Ricardo Trainotti [UNIFESP]
Tradução Automática
Viés de Gênero
Processamento de Linguagem Natural
Fine-Tuning
Equidade
title_short Mitigando viés de gênero na tradução automática para o português
title_full Mitigando viés de gênero na tradução automática para o português
title_fullStr Mitigando viés de gênero na tradução automática para o português
title_full_unstemmed Mitigando viés de gênero na tradução automática para o português
title_sort Mitigando viés de gênero na tradução automática para o português
author Rabonato, Ricardo Trainotti [UNIFESP]
author_facet Rabonato, Ricardo Trainotti [UNIFESP]
author_role author
dc.contributor.advisorLattes.none.fl_str_mv http://lattes.cnpq.br/9064767888093340
dc.contributor.authorLattes.none.fl_str_mv http://lattes.cnpq.br/8475909935036978
dc.contributor.author.fl_str_mv Rabonato, Ricardo Trainotti [UNIFESP]
dc.contributor.advisor1.fl_str_mv Berton, Lilian [UNIFESP]
contributor_str_mv Berton, Lilian [UNIFESP]
dc.subject.por.fl_str_mv Tradução Automática
Viés de Gênero
Processamento de Linguagem Natural
Fine-Tuning
Equidade
topic Tradução Automática
Viés de Gênero
Processamento de Linguagem Natural
Fine-Tuning
Equidade
description A Tradução Automática (TA) tornou-se uma ferramenta essencial na era da globalização, facilitando a comunicação e o acesso à informação em diversas línguas. No entanto, a presença de viés em modelos de TA representa um desafio significativo, especialmente em línguas menos populares como o Português. Um dos desafios está relacionado à presença de viés de gênero na tradução, em que estereótipos e desigualdades sociais podem ser inadvertidamente perpetuados. Esta pesquisa se concentra em abordar e mitigar o viés de gênero em modelos de TA do Inglês para o Português, uma área ainda pouco explorada em comparação com outros pares de línguas. O foco era desenvolver uma metodologia que preservasse a precisão das traduções, ao mesmo tempo em que promovia a equidade de gênero nos textos gerados. Para isso, a estratégia adotada foi a de aplicar técnicas de ajuste fino (fine-tuning) em um modelo de TA pré-treinado, visando otimizar os parâmetros do modelo para alcançar traduções precisas e reduzir o viés de gênero. A pesquisa desenvolveu um processo de ajuste fino focado na redução do viés, que inclui a criação de um corpus paralelo Inglês-Português equilibrado em relação à representação estereotipada / não estereotipada de gênero. Foi utilizado o modelo de TA pré-treinado MarianMT como base, o qual foi ajustado utilizando um conjunto de dados específico, visando mitigar o viés de gênero nas traduções do Inglês para o Português, sem comprometer demasiadamente a qualidade do modelo original. Os resultados, medidos com base no conjunto de testes WinoMT, determinados pelos indicadores ∆G, ∆S e a acurácia global (preservação do gênero da entidade principal do original), mostraram uma melhoria significativa na equidade de gênero após o emprego do fine-tuning, embora com uma ligeira redução na qualidade da tradução, verificada pela pontuação BLEU (BiLingual Evaluation Understudy). Este estudo não só demonstra a eficácia do fine-tuning para atenuar o viés de gênero em traduções do Inglês para o Português, mas também contribui para a compreensão mais ampla de como abordar este desafio e abre caminhos para futuras pesquisas na área, ressaltando a importância de criar sistemas de inteligência artificial mais inclusivos e eticamente responsáveis.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-04-10T16:10:05Z
dc.date.available.fl_str_mv 2024-04-10T16:10:05Z
dc.date.issued.fl_str_mv 2024-02-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/11600/70983
url https://hdl.handle.net/11600/70983
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 102 f.
dc.coverage.spatial.none.fl_str_mv São José dos Campos, SP
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo
publisher.none.fl_str_mv Universidade Federal de São Paulo
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
bitstream.url.fl_str_mv https://repositorio.unifesp.br/bitstreams/c2370846-df79-489f-baeb-dbc99a02a244/download
https://repositorio.unifesp.br/bitstreams/73e9c82e-9dae-4147-b91e-c6a8a40dfa17/download
https://repositorio.unifesp.br/bitstreams/83ded2f0-e031-4052-8e26-c088f58b7da1/download
https://repositorio.unifesp.br/bitstreams/b0899d98-93cf-4012-97d1-7a15cc41d091/download
bitstream.checksum.fl_str_mv 55565f8c19615e97698736bd0a939a05
859ba7aac438f424e54bd364c2aecf3c
493f8f0851642d6717dd67e36ee8cdb1
bfc441d6680b040acd66ccfeb95f7c6a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv
_version_ 1803210219252088832