Detecting transient faults in the configurable reconfigurable core architecture without false error signals

Detalhes bibliográficos
Autor(a) principal: Ferreira, Luigi Vaz
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/86843
Resumo: Tolerância a falhas é uma questão importante a se preocupar no mundo da computação. A detecção de erros providos de falhas transientes, entre outras fontes de erros, em uma determinada região de uma arquitetura de computador é necessária para aumentar a confiança da arquitetura. Redundância no tempo a nível de circuito (NICOLAIDIS, 1999) é uma boa técnica para detectar erros transientes (erros causados por falhas transientes) com um baixo impacto na área a priori. Este trabalho apresenta duas implementações desta técnica, bem como as condições que são necessárias respeitar para maximizar a detecção sem a geração de sinais falsos de erro. Adicionalmente, as implementações são usadas para construir o componente que é parte de um módulo flexível de tratamento de erro (flexible error handling module - FEHM -) (SCHWEIZER et al., 2012). Este módulo é incorporado na arquitetura Configurable Reconfigurable Core (CRC) (OPPOLD et al., 2007) com o objetivo de detectar e mascarar erros causados por falhas permanentes e transientes. Como esperado, as simulações confirmam que as condições formuladas evitam a geração de sinais falsos de erros. Entretanto, os resultados de sintese mostram que a técnica pode impactar, não somente em área, mas também na performance do circuito. Além disso, simulações com injeção de falhas apresentam que o FEHM possui uma vulnerabilidade na presença de falhas transientes.
id UFRGS-2_645d91f54163a8cbb58f91ce2bef43b7
oai_identifier_str oai:www.lume.ufrgs.br:10183/86843
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Ferreira, Luigi VazKastensmidt, Fernanda Gusmão de Lima2014-01-24T01:53:55Z2013http://hdl.handle.net/10183/86843000910215Tolerância a falhas é uma questão importante a se preocupar no mundo da computação. A detecção de erros providos de falhas transientes, entre outras fontes de erros, em uma determinada região de uma arquitetura de computador é necessária para aumentar a confiança da arquitetura. Redundância no tempo a nível de circuito (NICOLAIDIS, 1999) é uma boa técnica para detectar erros transientes (erros causados por falhas transientes) com um baixo impacto na área a priori. Este trabalho apresenta duas implementações desta técnica, bem como as condições que são necessárias respeitar para maximizar a detecção sem a geração de sinais falsos de erro. Adicionalmente, as implementações são usadas para construir o componente que é parte de um módulo flexível de tratamento de erro (flexible error handling module - FEHM -) (SCHWEIZER et al., 2012). Este módulo é incorporado na arquitetura Configurable Reconfigurable Core (CRC) (OPPOLD et al., 2007) com o objetivo de detectar e mascarar erros causados por falhas permanentes e transientes. Como esperado, as simulações confirmam que as condições formuladas evitam a geração de sinais falsos de erros. Entretanto, os resultados de sintese mostram que a técnica pode impactar, não somente em área, mas também na performance do circuito. Além disso, simulações com injeção de falhas apresentam que o FEHM possui uma vulnerabilidade na presença de falhas transientes.Fault tolerance is an important issue to worry about in the computing world. The detection of errors provided by transient faults, among others source of errors, in a determined region of a computer architecture is necessary to increase the reliability of the architecture. Circuit level time-redundancy (NICOLAIDIS, 1999) is a good technique to detect transient errors (those caused by transient faults) with low impact in area in a first moment. This work presents two implementations of the technique and the conditions we must respect in order to maximize the error detection without generating false errors signals. In addition, these implementations are used to construct the component that is part of a flexible error handling module (FEHM) (SCHWEIZER et al., 2012). This module is incorporated in the Configurable Reconfigurable Core (OPPOLD et al., 2007) architecture in order to detect and mask errors caused by permanent and transient faults. As a result, the simulations confirm that the conditions formulated avoids the false errors signals generation. However, the synthesis results shows that the technique can impact, not only in the area, but also in the performance of the circuit. Furthermore, fault injection simulations show that the FEHM has a vulnerability in the presence of transient faults.application/pdfengMicroeletrônicaTolerancia : FalhasFault toleranceTransient faultsCircuit level time-redundancyCGRADetecting transient faults in the configurable reconfigurable core architecture without false error signalsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2013Ciência da Computação: Ênfase em Engenharia da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000910215.pdf000910215.pdfTexto completo (inglês)application/pdf1094107http://www.lume.ufrgs.br/bitstream/10183/86843/1/000910215.pdf3786e60c83d0e86e62a5235c757cfeebMD51TEXT000910215.pdf.txt000910215.pdf.txtExtracted Texttext/plain160512http://www.lume.ufrgs.br/bitstream/10183/86843/2/000910215.pdf.txta1591fe32e1fde5ea1abfa1b044dac0fMD52THUMBNAIL000910215.pdf.jpg000910215.pdf.jpgGenerated Thumbnailimage/jpeg983http://www.lume.ufrgs.br/bitstream/10183/86843/3/000910215.pdf.jpg92cb005527ef9feb2f41dd481bab373bMD5310183/868432021-05-07 04:43:25.970376oai:www.lume.ufrgs.br:10183/86843Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2021-05-07T07:43:25Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Detecting transient faults in the configurable reconfigurable core architecture without false error signals
title Detecting transient faults in the configurable reconfigurable core architecture without false error signals
spellingShingle Detecting transient faults in the configurable reconfigurable core architecture without false error signals
Ferreira, Luigi Vaz
Microeletrônica
Tolerancia : Falhas
Fault tolerance
Transient faults
Circuit level time-redundancy
CGRA
title_short Detecting transient faults in the configurable reconfigurable core architecture without false error signals
title_full Detecting transient faults in the configurable reconfigurable core architecture without false error signals
title_fullStr Detecting transient faults in the configurable reconfigurable core architecture without false error signals
title_full_unstemmed Detecting transient faults in the configurable reconfigurable core architecture without false error signals
title_sort Detecting transient faults in the configurable reconfigurable core architecture without false error signals
author Ferreira, Luigi Vaz
author_facet Ferreira, Luigi Vaz
author_role author
dc.contributor.author.fl_str_mv Ferreira, Luigi Vaz
dc.contributor.advisor1.fl_str_mv Kastensmidt, Fernanda Gusmão de Lima
contributor_str_mv Kastensmidt, Fernanda Gusmão de Lima
dc.subject.por.fl_str_mv Microeletrônica
Tolerancia : Falhas
topic Microeletrônica
Tolerancia : Falhas
Fault tolerance
Transient faults
Circuit level time-redundancy
CGRA
dc.subject.eng.fl_str_mv Fault tolerance
Transient faults
Circuit level time-redundancy
CGRA
description Tolerância a falhas é uma questão importante a se preocupar no mundo da computação. A detecção de erros providos de falhas transientes, entre outras fontes de erros, em uma determinada região de uma arquitetura de computador é necessária para aumentar a confiança da arquitetura. Redundância no tempo a nível de circuito (NICOLAIDIS, 1999) é uma boa técnica para detectar erros transientes (erros causados por falhas transientes) com um baixo impacto na área a priori. Este trabalho apresenta duas implementações desta técnica, bem como as condições que são necessárias respeitar para maximizar a detecção sem a geração de sinais falsos de erro. Adicionalmente, as implementações são usadas para construir o componente que é parte de um módulo flexível de tratamento de erro (flexible error handling module - FEHM -) (SCHWEIZER et al., 2012). Este módulo é incorporado na arquitetura Configurable Reconfigurable Core (CRC) (OPPOLD et al., 2007) com o objetivo de detectar e mascarar erros causados por falhas permanentes e transientes. Como esperado, as simulações confirmam que as condições formuladas evitam a geração de sinais falsos de erros. Entretanto, os resultados de sintese mostram que a técnica pode impactar, não somente em área, mas também na performance do circuito. Além disso, simulações com injeção de falhas apresentam que o FEHM possui uma vulnerabilidade na presença de falhas transientes.
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2014-01-24T01:53:55Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/86843
dc.identifier.nrb.pt_BR.fl_str_mv 000910215
url http://hdl.handle.net/10183/86843
identifier_str_mv 000910215
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/86843/1/000910215.pdf
http://www.lume.ufrgs.br/bitstream/10183/86843/2/000910215.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/86843/3/000910215.pdf.jpg
bitstream.checksum.fl_str_mv 3786e60c83d0e86e62a5235c757cfeeb
a1591fe32e1fde5ea1abfa1b044dac0f
92cb005527ef9feb2f41dd481bab373b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224458604642304