Viés de gênero na ordenação alfabética de nomes

Detalhes bibliográficos
Autor(a) principal: Lima, Daniel Sullivan de Carvalho
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UNIFOR
Texto Completo: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/122913
Resumo: Nós investigamos empiricamente, se uma população, quando ordenada alfabeticamente pelo nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que usuários tomem decisões (e.g. escolhendo crianças para adoção ou oferecendo uma oportunidade de trabalho aos trabalhadores). Se a ordenação alfabética mantiver uma baixa representação de pessoas de um determinado gênero entre os Top-k indivíduos, oportunidades podem estar sendo negadas a pessoas desse gênero. O trabalho de pesquisa foi realizado com a exploração de nove conjuntos de dados de primeiros nomes de populações de diferentes países. Cada conjunto de dados tem a frequência de adoção do primeiro nome no país. Os resultados obtidos a partir de amostras desses conjuntos de dados mostram que a ordenação alfabética de nomes implica em desequilíbrios significativos da população em relação ao gênero. Tipicamente, para as amostras, os Top-10 indivíduos têm uma proporção menor de mulheres do que homens em comparação com a proporção de todo o conjunto. Uma medida de justiça também foi usada para quantificar o risco de que uma amostra de n pessoas, quando ordenada alfabeticamente pelo nome, tivesse um desequilíbrio de gênero nos Top-k indivíduos. A aplicação desta medida mostrou que amostras de indivíduos com os primeiros nomes espanhóis, quando ordenadas alfabeticamente, são mais propensas a desequilíbrios entre os gêneros do que os exemplos de indivíduos com o primeiro nome em outros idiomas. Como consequência, essas amostras são mais propensas a induzir viés na tomada de decisão. Além disso, foi desenvolvido um portal colaborativo em que os usuários poderão compartilhar listas com nomes de diversas nações, possibilitando assim que pesquisadores possam aprofundar o estudo deste problema. Outra utilidade da ferramenta é que qualquer pessoa pode carregar uma lista de indivíduos e o sistema irá averiguar o nível de viés que a mesma apresenta de acordo com a medida de justiça. As listas carregadas pelos usuários também são posicionadas em relação as listas dos outros países e informações sobre elas também serão apresentadas. Palavras-chave: Viés de Gênero | Medida de Justiça | Ordenação Alfabética
id UFOR_edd0167d652b2e6592dcbed02bef83c4
oai_identifier_str oai::122913
network_acronym_str UFOR
network_name_str Biblioteca Digital de Teses e Dissertações da UNIFOR
repository_id_str
spelling Viés de gênero na ordenação alfabética de nomesSistema de recuperação da informaçãoOrdenaçõesNós investigamos empiricamente, se uma população, quando ordenada alfabeticamente pelo nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que usuários tomem decisões (e.g. escolhendo crianças para adoção ou oferecendo uma oportunidade de trabalho aos trabalhadores). Se a ordenação alfabética mantiver uma baixa representação de pessoas de um determinado gênero entre os Top-k indivíduos, oportunidades podem estar sendo negadas a pessoas desse gênero. O trabalho de pesquisa foi realizado com a exploração de nove conjuntos de dados de primeiros nomes de populações de diferentes países. Cada conjunto de dados tem a frequência de adoção do primeiro nome no país. Os resultados obtidos a partir de amostras desses conjuntos de dados mostram que a ordenação alfabética de nomes implica em desequilíbrios significativos da população em relação ao gênero. Tipicamente, para as amostras, os Top-10 indivíduos têm uma proporção menor de mulheres do que homens em comparação com a proporção de todo o conjunto. Uma medida de justiça também foi usada para quantificar o risco de que uma amostra de n pessoas, quando ordenada alfabeticamente pelo nome, tivesse um desequilíbrio de gênero nos Top-k indivíduos. A aplicação desta medida mostrou que amostras de indivíduos com os primeiros nomes espanhóis, quando ordenadas alfabeticamente, são mais propensas a desequilíbrios entre os gêneros do que os exemplos de indivíduos com o primeiro nome em outros idiomas. Como consequência, essas amostras são mais propensas a induzir viés na tomada de decisão. Além disso, foi desenvolvido um portal colaborativo em que os usuários poderão compartilhar listas com nomes de diversas nações, possibilitando assim que pesquisadores possam aprofundar o estudo deste problema. Outra utilidade da ferramenta é que qualquer pessoa pode carregar uma lista de indivíduos e o sistema irá averiguar o nível de viés que a mesma apresenta de acordo com a medida de justiça. As listas carregadas pelos usuários também são posicionadas em relação as listas dos outros países e informações sobre elas também serão apresentadas. Palavras-chave: Viés de Gênero | Medida de Justiça | Ordenação AlfabéticaWe empirically investigate, whether a population, when alphabetically ordered by name, shows an imbalance of its Top-k individuals in respect to gender. Our motivation is that, to improve usability, information systems often order individuals¿ names for users to make decisions (e.g., in choosing children for adoption or offering a job opportunity to workers). If alphabetic ordering maintains a low representation of people of a particular gender among the Top-k individuals, opportunities may be denied to people of this gender. The research was carried out with the exploration of nine datasets of populations first names. Each dataset has the frequency of adoption of the first name in the country. The results obtained from samples of these datasets show that the alphabetical ordering of names implies significant imbalances of the population in respect to gender. Typically the Top-10 individuals have a lower proportion of women than men compared to the proportion of the whole set. A fairness measure was also used to quantify the risk that a sample of n people, when placed alphabetically by name, would have an imbalance in the Top-k individuals of the sample population in relation to gender. The application of this measure has shown that samples of individuals with Spanish first names when alphabetically ordered, are more prone to gender imbalance among their Top-k individuals than samples of individuals with first name in other languages. As a consequence, these samples are more likely to induce bias in decision making. In addition, a collaborative plataform has been developed where users are able to share lists with names from different nations, thus enabling researchers to further study this problem. Another usefulness of the tool is that anyone can upload a list of individuals and the system will check the level of bias it presents according to the fairness measure. Lists uploaded by users are also ranked relative to lists in other countries and information about them will also be displayed. Keywords: Gender Bias | Fairness Measure | Alphabetical OrderDissertação enviada com autorização e certificação via CI 143724/19Furtado, João José Vasco PeixotoFurtado, João José Vasco PeixotoCaminha Neto, Carlos de OliveiraPaixão, Matheus Henrique EstevesReis, Saulo Davi Soares eUniversidade de Fortaleza. Programa de Pós-Graduação em Informática AplicadaLima, Daniel Sullivan de Carvalho2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/122913https://uol.unifor.br/auth-sophia/exibicao/23539porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess1899-12-30T00:00:00Zoai::122913Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br||bib@unifor.bropendoar:1899-12-30T00:00Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false
dc.title.none.fl_str_mv Viés de gênero na ordenação alfabética de nomes
title Viés de gênero na ordenação alfabética de nomes
spellingShingle Viés de gênero na ordenação alfabética de nomes
Lima, Daniel Sullivan de Carvalho
Sistema de recuperação da informação
Ordenações
title_short Viés de gênero na ordenação alfabética de nomes
title_full Viés de gênero na ordenação alfabética de nomes
title_fullStr Viés de gênero na ordenação alfabética de nomes
title_full_unstemmed Viés de gênero na ordenação alfabética de nomes
title_sort Viés de gênero na ordenação alfabética de nomes
author Lima, Daniel Sullivan de Carvalho
author_facet Lima, Daniel Sullivan de Carvalho
author_role author
dc.contributor.none.fl_str_mv Furtado, João José Vasco Peixoto
Furtado, João José Vasco Peixoto
Caminha Neto, Carlos de Oliveira
Paixão, Matheus Henrique Esteves
Reis, Saulo Davi Soares e
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
dc.contributor.author.fl_str_mv Lima, Daniel Sullivan de Carvalho
dc.subject.por.fl_str_mv Sistema de recuperação da informação
Ordenações
topic Sistema de recuperação da informação
Ordenações
description Nós investigamos empiricamente, se uma população, quando ordenada alfabeticamente pelo nome, mostra um desequilíbrio de seus Top-k indivíduos em relação ao gênero. Nossa motivação é que, para melhorar a usabilidade, os sistemas de informação geralmente ordenam listas de nomes de indivíduos para que usuários tomem decisões (e.g. escolhendo crianças para adoção ou oferecendo uma oportunidade de trabalho aos trabalhadores). Se a ordenação alfabética mantiver uma baixa representação de pessoas de um determinado gênero entre os Top-k indivíduos, oportunidades podem estar sendo negadas a pessoas desse gênero. O trabalho de pesquisa foi realizado com a exploração de nove conjuntos de dados de primeiros nomes de populações de diferentes países. Cada conjunto de dados tem a frequência de adoção do primeiro nome no país. Os resultados obtidos a partir de amostras desses conjuntos de dados mostram que a ordenação alfabética de nomes implica em desequilíbrios significativos da população em relação ao gênero. Tipicamente, para as amostras, os Top-10 indivíduos têm uma proporção menor de mulheres do que homens em comparação com a proporção de todo o conjunto. Uma medida de justiça também foi usada para quantificar o risco de que uma amostra de n pessoas, quando ordenada alfabeticamente pelo nome, tivesse um desequilíbrio de gênero nos Top-k indivíduos. A aplicação desta medida mostrou que amostras de indivíduos com os primeiros nomes espanhóis, quando ordenadas alfabeticamente, são mais propensas a desequilíbrios entre os gêneros do que os exemplos de indivíduos com o primeiro nome em outros idiomas. Como consequência, essas amostras são mais propensas a induzir viés na tomada de decisão. Além disso, foi desenvolvido um portal colaborativo em que os usuários poderão compartilhar listas com nomes de diversas nações, possibilitando assim que pesquisadores possam aprofundar o estudo deste problema. Outra utilidade da ferramenta é que qualquer pessoa pode carregar uma lista de indivíduos e o sistema irá averiguar o nível de viés que a mesma apresenta de acordo com a medida de justiça. As listas carregadas pelos usuários também são posicionadas em relação as listas dos outros países e informações sobre elas também serão apresentadas. Palavras-chave: Viés de Gênero | Medida de Justiça | Ordenação Alfabética
publishDate 2019
dc.date.none.fl_str_mv 2019
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/122913
url https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/122913
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://uol.unifor.br/auth-sophia/exibicao/23539
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR
instname:Universidade de Fortaleza (UNIFOR)
instacron:UNIFOR
instname_str Universidade de Fortaleza (UNIFOR)
instacron_str UNIFOR
institution UNIFOR
reponame_str Biblioteca Digital de Teses e Dissertações da UNIFOR
collection Biblioteca Digital de Teses e Dissertações da UNIFOR
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)
repository.mail.fl_str_mv bib@unifor.br||bib@unifor.br
_version_ 1800408706426339328