Scientific metrics on bibliometric studies: detection of outliers for univariate data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Outros Autores: | , , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Em Questão (Online) |
Texto Completo: | https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030 |
Resumo: | This study presents formulas for detection of outliers for univariate data, taking into consideration the positive as well as the negative asymmetry of data. This new formula is based on the Exploratory Data Analysis and is simulated through the comparison of the outcome of the Exploratory Data Analysis found in statistical text books and statistical software. However, only normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are applied. Real data published in two scientific papers on metrics are used for the simulation. For moderate or strong positive (negative) asymmetries, the new formulation detects a lower (higher) quantity of superior outliers. It is important to take into account the existence of outliers in bibliometric data; it is recommended to quantify the influence of outliers in statistical calculation, such as mean and standard deviation. |
id |
UFRGS-8_d689047a44311c733f5fa2b5febcb4f5 |
---|---|
oai_identifier_str |
oai:seer.ufrgs.br:article/68030 |
network_acronym_str |
UFRGS-8 |
network_name_str |
Em Questão (Online) |
repository_id_str |
|
spelling |
Scientific metrics on bibliometric studies: detection of outliers for univariate dataMétricas científicas em estudos bibliométricos: detecção de outliers para dados univariadosOutliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado.Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate.This study presents formulas for detection of outliers for univariate data, taking into consideration the positive as well as the negative asymmetry of data. This new formula is based on the Exploratory Data Analysis and is simulated through the comparison of the outcome of the Exploratory Data Analysis found in statistical text books and statistical software. However, only normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are applied. Real data published in two scientific papers on metrics are used for the simulation. For moderate or strong positive (negative) asymmetries, the new formulation detects a lower (higher) quantity of superior outliers. It is important to take into account the existence of outliers in bibliometric data; it is recommended to quantify the influence of outliers in statistical calculation, such as mean and standard deviation.Apresenta fórmulas, para dados univariados, de detecção de outliers que levem em conta a assimetria dos dados, tanto positiva como negativa. A nova formulação, proveniente da Análise Exploratória de Dados, é simulada comparando os resultados com a proposta oriunda da Análise Exploratória de Dados, presente na maioria dos livros-textos de estatística e softwares estatísticos, mas que se aplica somente para distribuições normais ou gaussianas, ou seja, simétricas ou com leve assimetria. Para a simulação, são utilizados dados reais publicados por dois trabalhos na área de métricas científicas. Para assimetrias positivas (negativas) moderadas ou fortes, a nova formulação detecta menor (maior) quantidade de outliers superiores que a proposta clássica. É importante levar em conta a existência de outliers nos dados bibliométricos, pois recomendase quantificar a influência dos mesmos nos cálculos estatísticos, tais como média e desvio padrão.Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)2017-01-27info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAvaliado por Paresapplication/pdfhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/6803010.19132/1808-5245230.254-273Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-2731808-52451807-8893reponame:Em Questão (Online)instname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSporhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/68030/40124Copyright (c) 2017 Luís Fernando Maia Lima, Alexandre Masson Maroldi, Dávilla Vieira Odízio da Silva, Carlos Roberto Massao Hayashi, Maria Cristina Piumbato Innocentini Hayashihttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessMaia Lima, Luís FernandoMaroldi, Alexandre MassonSilva, Dávilla Vieira Odízio daHayashi, Carlos Roberto MassaoHayashi, Maria Cristina Piumbato Innocentini2023-12-08T13:18:18Zoai:seer.ufrgs.br:article/68030Revistahttps://seer.ufrgs.br/emquestao/PUBhttps://seer.ufrgs.br/EmQuestao/oaiemquestao@ufrgs.br||emquestao@ufrgs.br1808-52451807-8893opendoar:2023-12-08T13:18:18Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.none.fl_str_mv |
Scientific metrics on bibliometric studies: detection of outliers for univariate data Métricas científicas em estudos bibliométricos: detecção de outliers para dados univariados |
title |
Scientific metrics on bibliometric studies: detection of outliers for univariate data |
spellingShingle |
Scientific metrics on bibliometric studies: detection of outliers for univariate data Maia Lima, Luís Fernando Outliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado. Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate. |
title_short |
Scientific metrics on bibliometric studies: detection of outliers for univariate data |
title_full |
Scientific metrics on bibliometric studies: detection of outliers for univariate data |
title_fullStr |
Scientific metrics on bibliometric studies: detection of outliers for univariate data |
title_full_unstemmed |
Scientific metrics on bibliometric studies: detection of outliers for univariate data |
title_sort |
Scientific metrics on bibliometric studies: detection of outliers for univariate data |
author |
Maia Lima, Luís Fernando |
author_facet |
Maia Lima, Luís Fernando Maroldi, Alexandre Masson Silva, Dávilla Vieira Odízio da Hayashi, Carlos Roberto Massao Hayashi, Maria Cristina Piumbato Innocentini |
author_role |
author |
author2 |
Maroldi, Alexandre Masson Silva, Dávilla Vieira Odízio da Hayashi, Carlos Roberto Massao Hayashi, Maria Cristina Piumbato Innocentini |
author2_role |
author author author author |
dc.contributor.author.fl_str_mv |
Maia Lima, Luís Fernando Maroldi, Alexandre Masson Silva, Dávilla Vieira Odízio da Hayashi, Carlos Roberto Massao Hayashi, Maria Cristina Piumbato Innocentini |
dc.subject.por.fl_str_mv |
Outliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado. Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate. |
topic |
Outliers. Análise Exploratória de Dados. Assimetria. Bibliometria. Univariado. Outliers. Exploratory Data Analysis. Asymmetry. Bibliometry. Univariate. |
description |
This study presents formulas for detection of outliers for univariate data, taking into consideration the positive as well as the negative asymmetry of data. This new formula is based on the Exploratory Data Analysis and is simulated through the comparison of the outcome of the Exploratory Data Analysis found in statistical text books and statistical software. However, only normal or Gaussian distribution, i.e., symmetric or slightly asymmetric values, are applied. Real data published in two scientific papers on metrics are used for the simulation. For moderate or strong positive (negative) asymmetries, the new formulation detects a lower (higher) quantity of superior outliers. It is important to take into account the existence of outliers in bibliometric data; it is recommended to quantify the influence of outliers in statistical calculation, such as mean and standard deviation. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-01-27 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Avaliado por Pares |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030 10.19132/1808-5245230.254-273 |
url |
https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030 |
identifier_str_mv |
10.19132/1808-5245230.254-273 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://seer.ufrgs.br/index.php/EmQuestao/article/view/68030/40124 |
dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS) |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS) |
dc.source.none.fl_str_mv |
Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273 Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273 Em Questão; v. 23, Edição Especial 5 EBBC, 2017; 254-273 1808-5245 1807-8893 reponame:Em Questão (Online) instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Em Questão (Online) |
collection |
Em Questão (Online) |
repository.name.fl_str_mv |
Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
emquestao@ufrgs.br||emquestao@ufrgs.br |
_version_ |
1789438634556915712 |