Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPB |
Texto Completo: | https://repositorio.ufpb.br/jspui/handle/123456789/26323 |
Resumo: | Os sistemas de inteligência artificial para tomada de decisão têm se tornado cada vez mais populares em diversas áreas. Entretanto, é possível identificar decisões enviesadas em muitas aplicações, que se tornaram uma preocupação para as comunidades de ciência da computação, inteligência artificial e direito. Portanto, as pesquisas vêm propondo soluções para mitigar o viés e a discriminação presente nos tomadores de decisão. Algumas estratégias exploradas são baseadas em redes adversários generativas para gerar dados justos. Outros são baseados no aprendizado adversário para alcançar a justiça no aprendizado de máquina codificando restrições de justiça por meio de um componente adversário. Além disso, é comum que cada proposta avalie seu modelo com uma métrica específica, tornando a comparação das abordagens atuais uma tarefa complexa. Portanto, este trabalho propõe um procedimento de benchmark com um método sistemático para avaliar os modelos de aprendizado de máquina justo. Nesse sentido, definimos a métrica FU-score para avaliar o trade-off de utilidade e justiça, as métricas de utilidade e justiça para compor essa avaliação, o conjunto de dados utilizado e a preparação aplicada e o teste estatístico. Também realizamos esta avaliação de benchmark para os modelos adversários não generativos, analisando os modelos da literatura sob a mesma métrica. Essa avaliação não pôde apontar um único modelo com melhor desempenho para todos os conjuntos de dados. No entanto, construímos um entendimento de como cada modelo funciona em cada conjunto de dados com confiança estatística. |
id |
UFPB-2_f71e15f7a5a3a0dbf03860796c19898a |
---|---|
oai_identifier_str |
oai:repositorio.ufpb.br:123456789/26323 |
network_acronym_str |
UFPB-2 |
network_name_str |
Repositório Institucional da UFPB |
repository_id_str |
|
spelling |
2023-02-23T16:15:13Z2023-01-112023-02-23T16:15:13Z2022-08-26https://repositorio.ufpb.br/jspui/handle/123456789/26323Os sistemas de inteligência artificial para tomada de decisão têm se tornado cada vez mais populares em diversas áreas. Entretanto, é possível identificar decisões enviesadas em muitas aplicações, que se tornaram uma preocupação para as comunidades de ciência da computação, inteligência artificial e direito. Portanto, as pesquisas vêm propondo soluções para mitigar o viés e a discriminação presente nos tomadores de decisão. Algumas estratégias exploradas são baseadas em redes adversários generativas para gerar dados justos. Outros são baseados no aprendizado adversário para alcançar a justiça no aprendizado de máquina codificando restrições de justiça por meio de um componente adversário. Além disso, é comum que cada proposta avalie seu modelo com uma métrica específica, tornando a comparação das abordagens atuais uma tarefa complexa. Portanto, este trabalho propõe um procedimento de benchmark com um método sistemático para avaliar os modelos de aprendizado de máquina justo. Nesse sentido, definimos a métrica FU-score para avaliar o trade-off de utilidade e justiça, as métricas de utilidade e justiça para compor essa avaliação, o conjunto de dados utilizado e a preparação aplicada e o teste estatístico. Também realizamos esta avaliação de benchmark para os modelos adversários não generativos, analisando os modelos da literatura sob a mesma métrica. Essa avaliação não pôde apontar um único modelo com melhor desempenho para todos os conjuntos de dados. No entanto, construímos um entendimento de como cada modelo funciona em cada conjunto de dados com confiança estatística.Artificial intelligence systems for decision-making have become increasingly popular in several areas. However, it is possible to identify biased decisions in many applications, which have become a concern for the computer science, artificial intelligence, and law communities. Therefore, researches are proposing solutions to mitigate bias and discrimination in decision-makers. Some explored strategies are based on generative adversarial networks to generate fair data. Others are based on adversarial learning to achieve fairness in machine learning by encoding fairness constraints through an adversarial model. Moreover, it is usual for each proposal to assess its model with a specific metric, making the comparison of current approaches a complex task. Therefore, this work proposes a benchmark procedure with a systematical method to assess the fair machine learning models. In this sense, we define the FU-score metric to evaluate the utility-fairness trade-off, the utility and fairness metrics to compose this assessment, the used dataset and applied data preparation, and the statistical test. We also performed this benchmark evaluation for the non-generative adversarial models, analyzing the literature models from the same metric perspective. This assessment could not indicate a single model which better performs for all datasets. However, we built an understanding of how each model performs on each dataset which statistical confidence.Submitted by Fernando Augusto Alves Vieira (fernandovieira@biblioteca.ufpb.br) on 2023-02-13T16:16:25Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) LuizFernandoFonsêcaPinheiroDeLima_Dissert.pdf: 1308029 bytes, checksum: 25ad6d15c01dcdf7cc98d14bc23a84f4 (MD5)Approved for entry into archive by Biblioteca Digital de Teses e Dissertações BDTD (bdtd@biblioteca.ufpb.br) on 2023-02-23T16:15:13Z (GMT) No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) LuizFernandoFonsêcaPinheiroDeLima_Dissert.pdf: 1308029 bytes, checksum: 25ad6d15c01dcdf7cc98d14bc23a84f4 (MD5)Made available in DSpace on 2023-02-23T16:15:13Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) LuizFernandoFonsêcaPinheiroDeLima_Dissert.pdf: 1308029 bytes, checksum: 25ad6d15c01dcdf7cc98d14bc23a84f4 (MD5) Previous issue date: 2022-08-26Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESporUniversidade Federal da ParaíbaPrograma de Pós-Graduação em InformáticaUFPBBrasilInformáticaAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado adversárioAprendizado de máquinaBenchmarkTrade-offAdversarial LearningMachine LearningJustiçaFairnessUsing a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategiesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSiebra, Clauirton de Albuquerquehttp://lattes.cnpq.br/7707799028683443Ricarte, Danielle Rousy Diashttp://lattes.cnpq.br/460303528757556808025660494http://lattes.cnpq.br/8727341617324704Lima, Luiz Fernando Fonsêca Pinheiro dereponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPBTEXTLuizFernandoFonsêcaPinheiroDeLima_Dissert.pdf.txtLuizFernandoFonsêcaPinheiroDeLima_Dissert.pdf.txtExtracted texttext/plain258703https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/4/LuizFernandoFons%c3%aacaPinheiroDeLima_Dissert.pdf.txtd636e8aa8751ff865b80f45ef87a2e00MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82390https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/3/license.txte20ac18e101915e6935b82a641b985c0MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/2/license_rdfc4c98de35c20c53220c07884f4def27cMD52ORIGINALLuizFernandoFonsêcaPinheiroDeLima_Dissert.pdfLuizFernandoFonsêcaPinheiroDeLima_Dissert.pdfapplication/pdf1308029https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/1/LuizFernandoFons%c3%aacaPinheiroDeLima_Dissert.pdf25ad6d15c01dcdf7cc98d14bc23a84f4MD51123456789/263232023-05-22 09:53:41.747QVVUT1JJWkHDh8ODTyBFIExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBdXRvcml6byBlIGVzdG91IGRlIGFjb3JkbywgbmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbyBhdXRvLWRlcG9zaXRhZGEsIGNvbmZvcm1lIExlaSBuwrogOTYxMC85OCwgb3Mgc2VndWludGVzIHRlcm1vczoKIApEYSBEaXN0cmlidWnDp8OjbyBuw6NvLWV4Y2x1c2l2YSAKTyBhdXRvciBkZWNsYXJhIHF1ZTogCmEpIE8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0ZSB0ZXJtby4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuIApiKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0ZSB0ZXJtbywgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IGNvbnRlw7pkbyBkbyB0cmFiYWxobyBlbnRyZWd1ZS4gCmMpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCmQpIENvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBvIGRpcmVpdG8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIsIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KZSkgVm9jw6ogY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgcHVibGljYcOnw6NvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgpmKSBWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKRG9zIEVtYmFyZ29zIGUgUmVzdHJpw6fDtWVzIGRlIEFjZXNzbwpPIGVtYmFyZ28gcG9kZXLDoSBzZXIgbWFudGlkbyBwb3IgYXTDqSAxICh1bSkgYW5vLCBwb2RlbmRvIHNlciBwcm9ycm9nYWRvIHBvciBpZ3VhbCBwZXLDrW9kbywgY29tIGEgbmVjZXNzaWRhZGUgZGUgYW5leGFyIGRvY3VtZW50b3MgY29tcHJvYmF0w7NyaW9zLiBPIHJlc3VtbyBlIG9zIG1ldGFkYWRvcyBkZXNjcml0aXZvcyBzZXLDo28gZGlzcG9uaWJpbGl6YWRvcyBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCLgpPIGRlcMOzc2l0byBkbyB0cmFiYWxobyDDqSBvYnJpZ2F0w7NyaW8sIGluZGVwZW5kZW50ZSBkbyBlbWJhcmdvLgpRdWFuZG8gZW1iYXJnYWRvLCBvIHRyYWJhbGhvIHBlcm1hbmVjZXLDoSBpbmRpc3BvbsOtdmVsIGVucXVhbnRvIHZpZ29yYXIgYXMgcmVzdHJpw6fDtWVzLiBQYXNzYWRvIG8gcGVyw61vZG8gZG8gZW1iYXJnbywgbyB0cmFiYWxobyBzZXLDoSBhdXRvbWF0aWNhbWVudGUgZGlzcG9uaWJpbGl6YWRvIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEIuIAo=Repositório InstitucionalPUB |
dc.title.pt_BR.fl_str_mv |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
title |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
spellingShingle |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies Lima, Luiz Fernando Fonsêca Pinheiro de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado adversário Aprendizado de máquina Benchmark Trade-off Adversarial Learning Machine Learning Justiça Fairness |
title_short |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
title_full |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
title_fullStr |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
title_full_unstemmed |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
title_sort |
Using a fairness-utility trade-off metric to systematically benchmark non-generative fair adversarial learning strategies |
author |
Lima, Luiz Fernando Fonsêca Pinheiro de |
author_facet |
Lima, Luiz Fernando Fonsêca Pinheiro de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Siebra, Clauirton de Albuquerque |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7707799028683443 |
dc.contributor.advisor2.fl_str_mv |
Ricarte, Danielle Rousy Dias |
dc.contributor.advisor2Lattes.fl_str_mv |
http://lattes.cnpq.br/4603035287575568 |
dc.contributor.authorID.fl_str_mv |
08025660494 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/8727341617324704 |
dc.contributor.author.fl_str_mv |
Lima, Luiz Fernando Fonsêca Pinheiro de |
contributor_str_mv |
Siebra, Clauirton de Albuquerque Ricarte, Danielle Rousy Dias |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado adversário Aprendizado de máquina Benchmark Trade-off Adversarial Learning Machine Learning Justiça Fairness |
dc.subject.por.fl_str_mv |
Aprendizado adversário Aprendizado de máquina Benchmark Trade-off Adversarial Learning Machine Learning Justiça Fairness |
description |
Os sistemas de inteligência artificial para tomada de decisão têm se tornado cada vez mais populares em diversas áreas. Entretanto, é possível identificar decisões enviesadas em muitas aplicações, que se tornaram uma preocupação para as comunidades de ciência da computação, inteligência artificial e direito. Portanto, as pesquisas vêm propondo soluções para mitigar o viés e a discriminação presente nos tomadores de decisão. Algumas estratégias exploradas são baseadas em redes adversários generativas para gerar dados justos. Outros são baseados no aprendizado adversário para alcançar a justiça no aprendizado de máquina codificando restrições de justiça por meio de um componente adversário. Além disso, é comum que cada proposta avalie seu modelo com uma métrica específica, tornando a comparação das abordagens atuais uma tarefa complexa. Portanto, este trabalho propõe um procedimento de benchmark com um método sistemático para avaliar os modelos de aprendizado de máquina justo. Nesse sentido, definimos a métrica FU-score para avaliar o trade-off de utilidade e justiça, as métricas de utilidade e justiça para compor essa avaliação, o conjunto de dados utilizado e a preparação aplicada e o teste estatístico. Também realizamos esta avaliação de benchmark para os modelos adversários não generativos, analisando os modelos da literatura sob a mesma métrica. Essa avaliação não pôde apontar um único modelo com melhor desempenho para todos os conjuntos de dados. No entanto, construímos um entendimento de como cada modelo funciona em cada conjunto de dados com confiança estatística. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-08-26 |
dc.date.accessioned.fl_str_mv |
2023-02-23T16:15:13Z |
dc.date.available.fl_str_mv |
2023-01-11 2023-02-23T16:15:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpb.br/jspui/handle/123456789/26323 |
url |
https://repositorio.ufpb.br/jspui/handle/123456789/26323 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Informática |
dc.publisher.initials.fl_str_mv |
UFPB |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Informática |
publisher.none.fl_str_mv |
Universidade Federal da Paraíba |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
instname_str |
Universidade Federal da Paraíba (UFPB) |
instacron_str |
UFPB |
institution |
UFPB |
reponame_str |
Repositório Institucional da UFPB |
collection |
Repositório Institucional da UFPB |
bitstream.url.fl_str_mv |
https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/4/LuizFernandoFons%c3%aacaPinheiroDeLima_Dissert.pdf.txt https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/3/license.txt https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/2/license_rdf https://repositorio.ufpb.br/jspui/bitstream/123456789/26323/1/LuizFernandoFons%c3%aacaPinheiroDeLima_Dissert.pdf |
bitstream.checksum.fl_str_mv |
d636e8aa8751ff865b80f45ef87a2e00 e20ac18e101915e6935b82a641b985c0 c4c98de35c20c53220c07884f4def27c 25ad6d15c01dcdf7cc98d14bc23a84f4 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
|
repository.mail.fl_str_mv |
|
_version_ |
1777562283268898816 |