Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
Autor(a) principal: | |
---|---|
Data de Publicação: | 1998 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/ |
Resumo: | Os softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretas |
id |
USP_67d22142b9040c81ab73f87c48847778 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20200111-144800 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorialStatistical hypotheses with unbalanced data in the models of nested fixed effects in presence or not of scheme factorialANÁLISE DE DADOSDELINEAMENTO EXPERIMENTALHIPÓTESESMODELOS MATEMÁTICOSSOFTWARES ESTATÍSTICOSOs softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretasThe statistical softwares became an important and indispensable tool in the statistical analysis of data, mainly, due to the capacity of the computers today, such as its great speed and its low operational cost for arithmetic unit. Such characteristic, as well as the access easiness, caused the number of users of statistical softwares to grow considerably. Unfortunately, the difficulties found by the users of statistical softwares have been worsened by the lack of detailed information about the interpretations of statistical hypotheses in more complex models with unbalanced data, either in the literature or in the use manuals. Thus, the absence of manuals well documented in most of the softwares, has been inducing many users they to make misinterpretations of the hypotheses which can commit the results of their research. In that context, one of the natural objectives of this work, was the study of the models of nested fixed effects in presence or not of scheme factorial with unbalanced data. For those models, the terms of the respective sums of squares and more usual statistical hypotheses than they are tested for the main effects and interactions were formalized. The problem of the interpretation of hypotheses associated to the sums of squares provided universally by some of the systems statistical computational consecrated were also discussed. Seeking to enlarge the professionals' of the applied sciences horizons, users of available statistical computational systems in their research centers, the performance of some systems as the SAS ones, MINITAB, GLIM, BMDP, STATGRAPHICS, STATISTICA, SAEG, SANEST and NTIA were compared. According to the results, it was found that: - When the data are unbalanced with all the cells filled, but the leveIs of the factor C are different, then the sums of squares referring to the factor A supplied by the SAS-GLM don't test the hypotheses on the non-pondered averages proposed by Yates (1934), but a unusual hypothesis, generated from complex estimable functions of the type III. The sums of squares partial referring the factor A supplied by NTIA, also dont test the hypotheses on the non-pondered averages, when the data are unbalanced and the leveIs of the factor C are different. - The occurrence of unbalanced data in presence of empty cells can bring serious upset to the researchers of the applied sciences, regarding the interpretations of statistical hypotheses, because in most of the cases, the lack of an explicit documentation about what those softwares are calculating, can induce the taking of incorrect decisionsBiblioteca Digitais de Teses e Dissertações da USPIemma, Antonio FranciscoOikawa, Sérgio Minoru1998-10-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-01-12T03:05:01Zoai:teses.usp.br:tde-20200111-144800Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-12T03:05:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial Statistical hypotheses with unbalanced data in the models of nested fixed effects in presence or not of scheme factorial |
title |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial |
spellingShingle |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial Oikawa, Sérgio Minoru ANÁLISE DE DADOS DELINEAMENTO EXPERIMENTAL HIPÓTESES MODELOS MATEMÁTICOS SOFTWARES ESTATÍSTICOS |
title_short |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial |
title_full |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial |
title_fullStr |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial |
title_full_unstemmed |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial |
title_sort |
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial |
author |
Oikawa, Sérgio Minoru |
author_facet |
Oikawa, Sérgio Minoru |
author_role |
author |
dc.contributor.none.fl_str_mv |
Iemma, Antonio Francisco |
dc.contributor.author.fl_str_mv |
Oikawa, Sérgio Minoru |
dc.subject.por.fl_str_mv |
ANÁLISE DE DADOS DELINEAMENTO EXPERIMENTAL HIPÓTESES MODELOS MATEMÁTICOS SOFTWARES ESTATÍSTICOS |
topic |
ANÁLISE DE DADOS DELINEAMENTO EXPERIMENTAL HIPÓTESES MODELOS MATEMÁTICOS SOFTWARES ESTATÍSTICOS |
description |
Os softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretas |
publishDate |
1998 |
dc.date.none.fl_str_mv |
1998-10-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/ |
url |
https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-144800/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257202399641600 |