Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão

Detalhes bibliográficos
Autor(a) principal: Soares, Letícia Sakamoto
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
eng
Título da fonte: Biblioteca Digital de Teses e Dissertações do Mackenzie
Texto Completo: https://dspace.mackenzie.br/handle/10899/29275
Resumo: Com os avanços no âmbito da Inteligência Artificial, Aprendizado de Máquina e outras abordagens analíticas, o algoritmo vem sendo modificado no sentido de substituir um ser humano em diversas tarefas simples e rotineiras. Contudo, há uma discussão no que tange as definições adequadas da justiça de dados, debate este que obtém a atenção de pesquisadores de numerosas áreas, como engenharia de software e direito, sociologia, por exemplo. Em consulta a literatura, nota-se indefinição sobre o significado do termo vieses algorítmicos. Como principais fontes de viés são apontados os dados de treinamento e o processo de construção de ferramentas utilizadas para decisões automatizadas. Sendo assim, enfatiza-se a necessidade de investir no aumento da transparência em todas as etapas da construção do algoritmo, desde a exploração do conjunto de dados até o desenvolvimento e a tomada de decisões, e transcender a objetividade desses elementos como, por exemplo, analisar a desigualdade social estrutural presente em dados. A problemática abordada nesta pesquisa visa atestar que as decisões guiadas por algoritmos sejam mais equitativas, apontando quais as variáveis que as influenciam. Com o objetivo de observar os impactos e influência que dados possam causar nos resultados dos algoritmos de tomada de decisão, existe na literatura uma base de dados de um estudo investigativo feito pela ProPublica sobre a ferramenta COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), pesquisa comumente citada na área de viés algoritmíco. Tomando como base as abordagens de análises da literatura, foi aplicada no conjunto de dados COMPAS uma Análise Exploratória para verificar a existência de desbalanceamento de classe, condição essa confirmada. Posteriormente foi aplicada a técnica de Self Organizing Map (SOM) como ferramenta de exploração dividida em três etapas para compreender o comportamento dos dados. Na primeira etapa, quando os dados estão desbalanceados pela classe e intraclasse, na segunda etapa, quando estão balanceados pela classe, e na terceira etapa, pela intraclasse. Com isso, foi possível observar como cada elemento do conjunto de dados estava disposto e a sua relevância no mapa SOM, e em conjunto com o Coeficiente de Gini compreender quais conjuntos de dados estão mais equitativos.
id UPM_94667fcc03db0810cc48ee26d81bb163
oai_identifier_str oai:dspace.mackenzie.br:10899/29275
network_acronym_str UPM
network_name_str Biblioteca Digital de Teses e Dissertações do Mackenzie
repository_id_str 10277
spelling Soares, Letícia SakamotoSilva, Leandro Augusto da2022-05-23T13:18:26Z2022-05-23T13:18:26Z2021-11-08Com os avanços no âmbito da Inteligência Artificial, Aprendizado de Máquina e outras abordagens analíticas, o algoritmo vem sendo modificado no sentido de substituir um ser humano em diversas tarefas simples e rotineiras. Contudo, há uma discussão no que tange as definições adequadas da justiça de dados, debate este que obtém a atenção de pesquisadores de numerosas áreas, como engenharia de software e direito, sociologia, por exemplo. Em consulta a literatura, nota-se indefinição sobre o significado do termo vieses algorítmicos. Como principais fontes de viés são apontados os dados de treinamento e o processo de construção de ferramentas utilizadas para decisões automatizadas. Sendo assim, enfatiza-se a necessidade de investir no aumento da transparência em todas as etapas da construção do algoritmo, desde a exploração do conjunto de dados até o desenvolvimento e a tomada de decisões, e transcender a objetividade desses elementos como, por exemplo, analisar a desigualdade social estrutural presente em dados. A problemática abordada nesta pesquisa visa atestar que as decisões guiadas por algoritmos sejam mais equitativas, apontando quais as variáveis que as influenciam. Com o objetivo de observar os impactos e influência que dados possam causar nos resultados dos algoritmos de tomada de decisão, existe na literatura uma base de dados de um estudo investigativo feito pela ProPublica sobre a ferramenta COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), pesquisa comumente citada na área de viés algoritmíco. Tomando como base as abordagens de análises da literatura, foi aplicada no conjunto de dados COMPAS uma Análise Exploratória para verificar a existência de desbalanceamento de classe, condição essa confirmada. Posteriormente foi aplicada a técnica de Self Organizing Map (SOM) como ferramenta de exploração dividida em três etapas para compreender o comportamento dos dados. Na primeira etapa, quando os dados estão desbalanceados pela classe e intraclasse, na segunda etapa, quando estão balanceados pela classe, e na terceira etapa, pela intraclasse. Com isso, foi possível observar como cada elemento do conjunto de dados estava disposto e a sua relevância no mapa SOM, e em conjunto com o Coeficiente de Gini compreender quais conjuntos de dados estão mais equitativos.MackPesquisa - Fundo Mackenzie de Pesquisahttps://dspace.mackenzie.br/handle/10899/29275porengUniversidade Presbiteriana MackenzieAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessviés algorítmicoredes neuraisrede de Kohonenmapas auto-organizáveis,discriminaçãoEquidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIEhttp://lattes.cnpq.br/1396385111251741https://orcid.org/0000-0002-8671-3102http://lattes.cnpq.br/1942480258890877https://orcid.org/0000-0002-3613-8250Menezes, Mario Olímpio dehttp://lattes.cnpq.br/4882949829423994https://orcid.org/0000-0003-0263-3541Sousa, Miguel Angelo de Abreu dehttp://lattes.cnpq.br/0722315364640409With advances in Artificial Intelligence, Machine Learning, and other analytical appro aches, the algorithm has been modified to replace a human being in several simple and routine tasks. However, there is a discussion regarding the appropriate definitions of data justice, a debate that gets the attention of researchers from numerous areas, such as soft ware engineering and law, sociology, for example. In consulting the literature, one notices vagueness about the meaning of the term algorithmic biases. As main sources of biases are pointed out the training data and the construction process of tools used for automated decisions. Thus, it is emphasized the need to invest in increasing transparency in all stages of algorithm construction, from the exploration of the data set to the development and decision-making, and transcend the objectivity of these elements as, for example, analyze the structural social inequality present in data. The problem addressed in this research aims to attest that the decisions guided by algorithms are more equitable, pointing out which variables influence them. In order to observe the impacts and influence that data can cause in the results of decision-making algorithms, there is in the literature a data base of an investigative study done by ProPublica about the tool COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), research commonly cited in the area of algorithmic bias. Based on the literature analysis approaches, an Exploratory Analysis was applied on the COMPAS dataset to verify the existence of class unbalance, and this condition was confirmed. Subsequently, the Self Organizing Map (SOM) techni que was applied as an exploration tool divided into three stages to understand the data behavior. In the first stage, when the data is unbalanced by class and intraclass, in the second stage, when it is balanced by class, and in the third stage, by intraclass. With this, it was possible to observe how each element of the data set was arranged and its relevance in the SOM map, and together with the Gini Coefficient understand which data sets are more equitablealgorithmic biasneural networksKohonen networkself-organizing mapsdiscriminationBrasilEscola de Engenharia Mackenzie (EE)UPMEngenharia Elétrica e ComputaçãoCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAORIGINALLETICIA SAKAMOTO SOARES - protegido.pdfLETICIA SAKAMOTO SOARES - protegido.pdfLetícia Sakamoto Soaresapplication/pdf1863503https://dspace.mackenzie.br/bitstreams/ac8d4547-dc0c-4eb4-8692-e41e249ece06/download72e411b41d782131a7c0f7fe64a639a7MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://dspace.mackenzie.br/bitstreams/f55b8e6d-c93e-4fc1-a62d-d4b9dc95d4fb/downloade39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81997https://dspace.mackenzie.br/bitstreams/0760b068-df4b-4e5e-a69b-6bbdee5eb46b/downloadfb735e1a8fa1feda568f1b61905f8d57MD53TEXTLETICIA SAKAMOTO SOARES - protegido.pdf.txtLETICIA SAKAMOTO SOARES - protegido.pdf.txtExtracted texttext/plain121078https://dspace.mackenzie.br/bitstreams/57ac374a-8d22-4fa1-b347-aa6e23c5bb6a/downloadb6b69c4c220161786caf350b003d7a76MD54THUMBNAILLETICIA SAKAMOTO SOARES - protegido.pdf.jpgLETICIA SAKAMOTO SOARES - protegido.pdf.jpgGenerated Thumbnailimage/jpeg1227https://dspace.mackenzie.br/bitstreams/f6520ec0-be94-4cfd-a300-86eef3982c2d/download736cd24866af3ac84e8fe1400f517bf5MD5510899/292752022-07-12 02:09:47.433http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Braziloai:dspace.mackenzie.br:10899/29275https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772022-07-12T02:09:47Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBzZXUgdHJhYmFsaG8gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgbyBzZXUgdHJhYmFsaG8gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZG8gc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkbyBzZXUgdHJhYmFsaG8gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc2V1IHRyYWJhbGhvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIGRlY2xhcmFyIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZG8gc2V1IHRyYWJhbGhvIG9yYSBkZXBvc2l0YWRvLgoKQ0FTTyBPIFRSQUJBTEhPIE9SQSBERVBPU0lUQURPIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgVU5JVkVSU0lEQURFIFBSRVNCSVRFUklBTkEgTUFDS0VOWklFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHNldSB0cmFiYWxobywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.pt_BR.fl_str_mv Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
title Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
spellingShingle Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
Soares, Letícia Sakamoto
viés algorítmico
redes neurais
rede de Kohonen
mapas auto-organizáveis,
discriminação
title_short Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
title_full Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
title_fullStr Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
title_full_unstemmed Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
title_sort Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
author Soares, Letícia Sakamoto
author_facet Soares, Letícia Sakamoto
author_role author
dc.contributor.author.fl_str_mv Soares, Letícia Sakamoto
dc.contributor.advisor1.fl_str_mv Silva, Leandro Augusto da
contributor_str_mv Silva, Leandro Augusto da
dc.subject.por.fl_str_mv viés algorítmico
redes neurais
rede de Kohonen
mapas auto-organizáveis,
discriminação
topic viés algorítmico
redes neurais
rede de Kohonen
mapas auto-organizáveis,
discriminação
description Com os avanços no âmbito da Inteligência Artificial, Aprendizado de Máquina e outras abordagens analíticas, o algoritmo vem sendo modificado no sentido de substituir um ser humano em diversas tarefas simples e rotineiras. Contudo, há uma discussão no que tange as definições adequadas da justiça de dados, debate este que obtém a atenção de pesquisadores de numerosas áreas, como engenharia de software e direito, sociologia, por exemplo. Em consulta a literatura, nota-se indefinição sobre o significado do termo vieses algorítmicos. Como principais fontes de viés são apontados os dados de treinamento e o processo de construção de ferramentas utilizadas para decisões automatizadas. Sendo assim, enfatiza-se a necessidade de investir no aumento da transparência em todas as etapas da construção do algoritmo, desde a exploração do conjunto de dados até o desenvolvimento e a tomada de decisões, e transcender a objetividade desses elementos como, por exemplo, analisar a desigualdade social estrutural presente em dados. A problemática abordada nesta pesquisa visa atestar que as decisões guiadas por algoritmos sejam mais equitativas, apontando quais as variáveis que as influenciam. Com o objetivo de observar os impactos e influência que dados possam causar nos resultados dos algoritmos de tomada de decisão, existe na literatura uma base de dados de um estudo investigativo feito pela ProPublica sobre a ferramenta COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), pesquisa comumente citada na área de viés algoritmíco. Tomando como base as abordagens de análises da literatura, foi aplicada no conjunto de dados COMPAS uma Análise Exploratória para verificar a existência de desbalanceamento de classe, condição essa confirmada. Posteriormente foi aplicada a técnica de Self Organizing Map (SOM) como ferramenta de exploração dividida em três etapas para compreender o comportamento dos dados. Na primeira etapa, quando os dados estão desbalanceados pela classe e intraclasse, na segunda etapa, quando estão balanceados pela classe, e na terceira etapa, pela intraclasse. Com isso, foi possível observar como cada elemento do conjunto de dados estava disposto e a sua relevância no mapa SOM, e em conjunto com o Coeficiente de Gini compreender quais conjuntos de dados estão mais equitativos.
publishDate 2021
dc.date.issued.fl_str_mv 2021-11-08
dc.date.accessioned.fl_str_mv 2022-05-23T13:18:26Z
dc.date.available.fl_str_mv 2022-05-23T13:18:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://dspace.mackenzie.br/handle/10899/29275
url https://dspace.mackenzie.br/handle/10899/29275
dc.language.iso.fl_str_mv por
eng
language por
eng
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie
instname:Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron:MACKENZIE
instname_str Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron_str MACKENZIE
institution MACKENZIE
reponame_str Biblioteca Digital de Teses e Dissertações do Mackenzie
collection Biblioteca Digital de Teses e Dissertações do Mackenzie
bitstream.url.fl_str_mv https://dspace.mackenzie.br/bitstreams/ac8d4547-dc0c-4eb4-8692-e41e249ece06/download
https://dspace.mackenzie.br/bitstreams/f55b8e6d-c93e-4fc1-a62d-d4b9dc95d4fb/download
https://dspace.mackenzie.br/bitstreams/0760b068-df4b-4e5e-a69b-6bbdee5eb46b/download
https://dspace.mackenzie.br/bitstreams/57ac374a-8d22-4fa1-b347-aa6e23c5bb6a/download
https://dspace.mackenzie.br/bitstreams/f6520ec0-be94-4cfd-a300-86eef3982c2d/download
bitstream.checksum.fl_str_mv 72e411b41d782131a7c0f7fe64a639a7
e39d27027a6cc9cb039ad269a5db8e34
fb735e1a8fa1feda568f1b61905f8d57
b6b69c4c220161786caf350b003d7a76
736cd24866af3ac84e8fe1400f517bf5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)
repository.mail.fl_str_mv repositorio@mackenzie.br||paola.damato@mackenzie.br
_version_ 1813819985981603840