O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW

Detalhes bibliográficos
Autor(a) principal: Freitas, Christian Daros de
Data de Publicação: 2003
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
Texto Completo: http://repositorio.ufes.br/handle/10/6349
Resumo: Superscalar machines fetch multiple scalar instructions per cycle from the instruction cache. However, machines that fetch no more than one instruction per cycle from the instruction cache, such as Dynamically Trace Scheduled VLIW (DTSVLIW) machines, have shown performance comparable to that of Superscalars. In this paper we present experiments which show that fetching a single instruction from the instruction cache per cycle allows the same performance achieved fetching multiple instructions per cycle thanks to the execution locality present in programs. We also present the first direct comparison between the Superscalars, Trace Cache and DTSVLIW architectures. Our results show that a DTSVLIW machine capable of executing up to 16 instructions per cycle can perform 21.9% better than a Superscalar and 6.6% better than a Trace Cache with equivalent hardware. In the comparison between a DTSVLIW machine and an Alpha 21264 machine, we have shown that the DTSVLIW can perform 24,17% better than Alpha using integer programs, and 60,36% better than Alpha using floating point programs.
id UFES_b08b6db56a180290abf98e8e15040bc8
oai_identifier_str oai:repositorio.ufes.br:10/6349
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str 2108
spelling Reis Junior, Neyval CostaSouza, Alberto Ferreira deFreitas, Christian Daros deSchneebeli, Hans Jorg AndreasFernandes, Edil Severiano Tavares2016-12-23T14:33:33Z2007-06-112016-12-23T14:33:33Z2003-10-29Superscalar machines fetch multiple scalar instructions per cycle from the instruction cache. However, machines that fetch no more than one instruction per cycle from the instruction cache, such as Dynamically Trace Scheduled VLIW (DTSVLIW) machines, have shown performance comparable to that of Superscalars. In this paper we present experiments which show that fetching a single instruction from the instruction cache per cycle allows the same performance achieved fetching multiple instructions per cycle thanks to the execution locality present in programs. We also present the first direct comparison between the Superscalars, Trace Cache and DTSVLIW architectures. Our results show that a DTSVLIW machine capable of executing up to 16 instructions per cycle can perform 21.9% better than a Superscalar and 6.6% better than a Trace Cache with equivalent hardware. In the comparison between a DTSVLIW machine and an Alpha 21264 machine, we have shown that the DTSVLIW can perform 24,17% better than Alpha using integer programs, and 60,36% better than Alpha using floating point programs.Máquinas Super Escalares trazem múltiplas instruções escalares da cache de instruções por ciclo. Contudo, máquinas que buscam na cache de instruções apenas uma instrução escalar por ciclo de relógio têm demonstrado níveis de desempenho comparáveis aos de máquinas Super Escalares, como é o caso de máquinas que seguem a arquitetura Dynamically Trace Scheduled VLIW (DTSVLIW). Neste trabalho, é mostrado através de experimentos que basta trazer uma instrução escalar por ciclo de máquina da cache de instruções para atingir praticamente o mesmo desempenho obtido trazendo várias instruções por ciclo graças à localidade de execução existente nos programas. Fazemos, também, a primeira comparação direta entre as arquiteturas Super Escalar, Trace Cache e DTSVLIW. Os resultados dos experimentos mostram que uma máquina DTSVLIW, capaz de executar até 16 instruções por ciclo, tem desempenho 21.9% superior que uma Super Escalar hipotética e 6.6% superior que uma Trace Cache com hardware equivalente. Quando comparada com uma máquina Alpha 21264, a máquina DTSVLIW apresenta um desempenho 24,17% superior, para os programas inteiros e, 60,36% superior, para os programas de ponto flutuante do SPEC2000.TextFREITAS, Christian Daros de. O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW. 2003. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2003.http://repositorio.ufes.br/handle/10/6349porUniversidade Federal do Espírito SantoMestrado em InformáticaPrograma de Pós-Graduação em InformáticaUFESBRCentro TecnológicoArquitetura de computadorMemória cacheCiência da Computação004O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIWinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALdissertacao.pdfapplication/pdf525748http://repositorio.ufes.br/bitstreams/4e8e3260-8713-4d2e-96a4-e6d6c8e0c78a/downloadd81fee4d754843c091457bdd3b0ce230MD5110/63492024-06-28 16:11:17.145oai:repositorio.ufes.br:10/6349http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-06-28T16:11:17Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
title O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
spellingShingle O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
Freitas, Christian Daros de
Ciência da Computação
Arquitetura de computador
Memória cache
004
title_short O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
title_full O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
title_fullStr O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
title_full_unstemmed O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
title_sort O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
author Freitas, Christian Daros de
author_facet Freitas, Christian Daros de
author_role author
dc.contributor.advisor-co1.fl_str_mv Reis Junior, Neyval Costa
dc.contributor.advisor1.fl_str_mv Souza, Alberto Ferreira de
dc.contributor.author.fl_str_mv Freitas, Christian Daros de
dc.contributor.referee1.fl_str_mv Schneebeli, Hans Jorg Andreas
dc.contributor.referee2.fl_str_mv Fernandes, Edil Severiano Tavares
contributor_str_mv Reis Junior, Neyval Costa
Souza, Alberto Ferreira de
Schneebeli, Hans Jorg Andreas
Fernandes, Edil Severiano Tavares
dc.subject.cnpq.fl_str_mv Ciência da Computação
topic Ciência da Computação
Arquitetura de computador
Memória cache
004
dc.subject.br-rjbn.none.fl_str_mv Arquitetura de computador
Memória cache
dc.subject.udc.none.fl_str_mv 004
description Superscalar machines fetch multiple scalar instructions per cycle from the instruction cache. However, machines that fetch no more than one instruction per cycle from the instruction cache, such as Dynamically Trace Scheduled VLIW (DTSVLIW) machines, have shown performance comparable to that of Superscalars. In this paper we present experiments which show that fetching a single instruction from the instruction cache per cycle allows the same performance achieved fetching multiple instructions per cycle thanks to the execution locality present in programs. We also present the first direct comparison between the Superscalars, Trace Cache and DTSVLIW architectures. Our results show that a DTSVLIW machine capable of executing up to 16 instructions per cycle can perform 21.9% better than a Superscalar and 6.6% better than a Trace Cache with equivalent hardware. In the comparison between a DTSVLIW machine and an Alpha 21264 machine, we have shown that the DTSVLIW can perform 24,17% better than Alpha using integer programs, and 60,36% better than Alpha using floating point programs.
publishDate 2003
dc.date.issued.fl_str_mv 2003-10-29
dc.date.available.fl_str_mv 2007-06-11
2016-12-23T14:33:33Z
dc.date.accessioned.fl_str_mv 2016-12-23T14:33:33Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FREITAS, Christian Daros de. O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW. 2003. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2003.
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/6349
identifier_str_mv FREITAS, Christian Daros de. O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW. 2003. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2003.
url http://repositorio.ufes.br/handle/10/6349
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Informática
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Informática
dc.publisher.initials.fl_str_mv UFES
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Centro Tecnológico
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Informática
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
bitstream.url.fl_str_mv http://repositorio.ufes.br/bitstreams/4e8e3260-8713-4d2e-96a4-e6d6c8e0c78a/download
bitstream.checksum.fl_str_mv d81fee4d754843c091457bdd3b0ce230
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv
_version_ 1804309163706155008