Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial

Detalhes bibliográficos
Autor(a) principal: Oikawa, Sérgio Minoru
Data de Publicação: 1998
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/
Resumo: Os softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretas
id USP_67d22142b9040c81ab73f87c48847778
oai_identifier_str oai:teses.usp.br:tde-20200111-144800
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorialStatistical hypotheses with unbalanced data in the models of nested fixed effects in presence or not of scheme factorialANÁLISE DE DADOSDELINEAMENTO EXPERIMENTALHIPÓTESESMODELOS MATEMÁTICOSSOFTWARES ESTATÍSTICOSOs softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretasThe statistical softwares became an important and indispensable tool in the statistical analysis of data, mainly, due to the capacity of the computers today, such as its great speed and its low operational cost for arithmetic unit. Such characteristic, as well as the access easiness, caused the number of users of statistical softwares to grow considerably. Unfortunately, the difficulties found by the users of statistical softwares have been worsened by the lack of detailed information about the interpretations of statistical hypotheses in more complex models with unbalanced data, either in the literature or in the use manuals. Thus, the absence of manuals well documented in most of the softwares, has been inducing many users they to make misinterpretations of the hypotheses which can commit the results of their research. In that context, one of the natural objectives of this work, was the study of the models of nested fixed effects in presence or not of scheme factorial with unbalanced data. For those models, the terms of the respective sums of squares and more usual statistical hypotheses than they are tested for the main effects and interactions were formalized. The problem of the interpretation of hypotheses associated to the sums of squares provided universally by some of the systems statistical computational consecrated were also discussed. Seeking to enlarge the professionals' of the applied sciences horizons, users of available statistical computational systems in their research centers, the performance of some systems as the SAS ones, MINITAB, GLIM, BMDP, STATGRAPHICS, STATISTICA, SAEG, SANEST and NTIA were compared. According to the results, it was found that: - When the data are unbalanced with all the cells filled, but the leveIs of the factor C are different, then the sums of squares referring to the factor A supplied by the SAS-GLM don't test the hypotheses on the non-pondered averages proposed by Yates (1934), but a unusual hypothesis, generated from complex estimable functions of the type III. The sums of squares partial referring the factor A supplied by NTIA, also don’t test the hypotheses on the non-pondered averages, when the data are unbalanced and the leveIs of the factor C are different. - The occurrence of unbalanced data in presence of empty cells can bring serious upset to the researchers of the applied sciences, regarding the interpretations of statistical hypotheses, because in most of the cases, the lack of an explicit documentation about what those softwares are calculating, can induce the taking of incorrect decisionsBiblioteca Digitais de Teses e Dissertações da USPIemma, Antonio FranciscoOikawa, Sérgio Minoru1998-10-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-01-12T03:05:01Zoai:teses.usp.br:tde-20200111-144800Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-12T03:05:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
Statistical hypotheses with unbalanced data in the models of nested fixed effects in presence or not of scheme factorial
title Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
spellingShingle Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
Oikawa, Sérgio Minoru
ANÁLISE DE DADOS
DELINEAMENTO EXPERIMENTAL
HIPÓTESES
MODELOS MATEMÁTICOS
SOFTWARES ESTATÍSTICOS
title_short Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
title_full Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
title_fullStr Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
title_full_unstemmed Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
title_sort Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
author Oikawa, Sérgio Minoru
author_facet Oikawa, Sérgio Minoru
author_role author
dc.contributor.none.fl_str_mv Iemma, Antonio Francisco
dc.contributor.author.fl_str_mv Oikawa, Sérgio Minoru
dc.subject.por.fl_str_mv ANÁLISE DE DADOS
DELINEAMENTO EXPERIMENTAL
HIPÓTESES
MODELOS MATEMÁTICOS
SOFTWARES ESTATÍSTICOS
topic ANÁLISE DE DADOS
DELINEAMENTO EXPERIMENTAL
HIPÓTESES
MODELOS MATEMÁTICOS
SOFTWARES ESTATÍSTICOS
description Os softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretas
publishDate 1998
dc.date.none.fl_str_mv 1998-10-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/
url https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257202399641600