Scientific metrics on bibliometric studies: detection of outliers for univariate data

Detalhes bibliográficos
Autor(a) principal: Maia Lima, Luís Fernando
Data de Publicação: 2017
Outros Autores: Maroldi, Alexandre Masson, Silva, Dávilla Vieira Odízio da, Hayashi, Carlos Roberto Massao, Hayashi, Maria Cristina Piumbato Innocentini
Tipo de documento: Artigo
Idioma: por
Título da fonte: Em Questão (Online)
Texto Completo: https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030
Resumo: This study presents formulas for detection of outliers for univariate data, taking into consideration the positive as well as the negative asymmetry of data. This new formula is based on the Exploratory Data Analysis and is simulated through the comparison of the outcome of the Exploratory Data Analysis found in statistical text books and statistical software. However, only normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are applied. Real data published in two scientific papers on metrics are used for the simulation. For moderate or strong positive (negative) asymmetries, the new formulation detects a lower (higher) quantity of superior outliers. It is important to take into account the existence of outliers in bibliometric data; it is recommended to quantify the influence of outliers in statistical calculation, such as mean and standard deviation.
id UFRGS-8_d689047a44311c733f5fa2b5febcb4f5
oai_identifier_str oai:seer.ufrgs.br:article/68030
network_acronym_str UFRGS-8
network_name_str Em Questão (Online)
repository_id_str
spelling Scientific metrics on bibliometric studies: detection of outliers for univariate dataMétricas científicas em estudos bibliométricos: detecção de outliers para dados univariadosOutliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado.Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate.This study presents formulas for detection of outliers for univariate data, taking into consideration the positive as well as the negative asymmetry of data. This new formula is based on the Exploratory Data Analysis and is simulated through the comparison of the outcome of the Exploratory Data Analysis found in statistical text books and statistical software. However, only normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are applied. Real data published in two scientific papers on metrics are used for the simulation. For moderate or strong positive (negative) asymmetries, the new formulation detects a lower (higher) quantity of superior outliers. It is important to take into account the existence of outliers in bibliometric data; it is recommended to quantify the influence of outliers in statistical calculation, such as mean and standard deviation.Apresenta fórmulas, para dados univariados, de detecção de outliers que levem em conta a assimetria dos dados, tanto positiva como negativa. A nova formulação, proveniente da Análise Exploratória de Dados, é simulada comparando os resultados com a proposta oriunda da Análise Exploratória de Dados, presente na maioria dos livros-textos de estatística e softwares estatísticos, mas que se aplica somente para distribuições normais ou gaussianas, ou seja, simétricas ou com leve assimetria. Para a simulação, são utilizados dados reais publicados por dois trabalhos na área de métricas científicas. Para assimetrias positivas (negativas) moderadas ou fortes, a nova formulação detecta menor (maior) quantidade de outliers superiores que a proposta clássica. É importante levar em conta a existência de outliers nos dados bibliométricos, pois recomendase quantificar a influência dos mesmos nos cálculos estatísticos, tais como média e desvio padrão.Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)2017-01-27info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAvaliado por Paresapplication/pdfhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/6803010.19132/1808-5245230.254-273Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-2731808-52451807-8893reponame:Em Questão (Online)instname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSporhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/68030/40124Copyright (c) 2017 Luís Fernando Maia Lima, Alexandre Masson Maroldi, Dávilla Vieira Odízio da Silva, Carlos Roberto Massao Hayashi, Maria Cristina Piumbato Innocentini Hayashihttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessMaia Lima, Luís FernandoMaroldi, Alexandre MassonSilva, Dávilla Vieira Odízio daHayashi, Carlos Roberto MassaoHayashi, Maria Cristina Piumbato Innocentini2023-12-08T13:18:18Zoai:seer.ufrgs.br:article/68030Revistahttps://seer.ufrgs.br/emquestao/PUBhttps://seer.ufrgs.br/EmQuestao/oaiemquestao@ufrgs.br||emquestao@ufrgs.br1808-52451807-8893opendoar:2023-12-08T13:18:18Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.none.fl_str_mv Scientific metrics on bibliometric studies: detection of outliers for univariate data
Métricas científicas em estudos bibliométricos: detecção de outliers para dados univariados
title Scientific metrics on bibliometric studies: detection of outliers for univariate data
spellingShingle Scientific metrics on bibliometric studies: detection of outliers for univariate data
Maia Lima, Luís Fernando
Outliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado.
Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate.
title_short Scientific metrics on bibliometric studies: detection of outliers for univariate data
title_full Scientific metrics on bibliometric studies: detection of outliers for univariate data
title_fullStr Scientific metrics on bibliometric studies: detection of outliers for univariate data
title_full_unstemmed Scientific metrics on bibliometric studies: detection of outliers for univariate data
title_sort Scientific metrics on bibliometric studies: detection of outliers for univariate data
author Maia Lima, Luís Fernando
author_facet Maia Lima, Luís Fernando
Maroldi, Alexandre Masson
Silva, Dávilla Vieira Odízio da
Hayashi, Carlos Roberto Massao
Hayashi, Maria Cristina Piumbato Innocentini
author_role author
author2 Maroldi, Alexandre Masson
Silva, Dávilla Vieira Odízio da
Hayashi, Carlos Roberto Massao
Hayashi, Maria Cristina Piumbato Innocentini
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Maia Lima, Luís Fernando
Maroldi, Alexandre Masson
Silva, Dávilla Vieira Odízio da
Hayashi, Carlos Roberto Massao
Hayashi, Maria Cristina Piumbato Innocentini
dc.subject.por.fl_str_mv Outliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado.
Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate.
topic Outliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado.
Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate.
description This study presents formulas for detection of outliers for univariate data, taking into consideration the positive as well as the negative asymmetry of data. This new formula is based on the Exploratory Data Analysis and is simulated through the comparison of the outcome of the Exploratory Data Analysis found in statistical text books and statistical software. However, only normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are applied. Real data published in two scientific papers on metrics are used for the simulation. For moderate or strong positive (negative) asymmetries, the new formulation detects a lower (higher) quantity of superior outliers. It is important to take into account the existence of outliers in bibliometric data; it is recommended to quantify the influence of outliers in statistical calculation, such as mean and standard deviation.
publishDate 2017
dc.date.none.fl_str_mv 2017-01-27
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Avaliado por Pares
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030
10.19132/1808-5245230.254-273
url https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030
identifier_str_mv 10.19132/1808-5245230.254-273
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030/40124
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)
dc.source.none.fl_str_mv Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273
Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273
Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273
1808-5245
1807-8893
reponame:Em Questão (Online)
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Em Questão (Online)
collection Em Questão (Online)
repository.name.fl_str_mv Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv emquestao@ufrgs.br||emquestao@ufrgs.br
_version_ 1789438634556915712