Developing a spell checker

Detalhes bibliográficos
Autor(a) principal: Araujo, Leonardo Carneiro de
Data de Publicação: 2021
Outros Autores: Benevides, Aline de Lima, Sansão, João Pedro Hallack
Tipo de documento: Artigo
Idioma: por
Título da fonte: Texto livre
Texto Completo: https://periodicos.ufmg.br/index.php/textolivre/article/view/26469
Resumo: Spell checkers are ubiquitous computational tools that help us in correctly writing texts or messages andimproving information inquiry and data mining. The present work presents the history of development of spellcheckers and illustrates how, in a simple way, it is possible to create an efficient spell checker from Norvig’sproposal. We also highlight some tools and how they are used in the development of spell checkers, such asaffix removal and n-gram computation. Moreover, we present an implementation of Norvig’s spell checkerand its performance in automatic correction for different spelling error data sets. Also, in a comparison ofspell checkers performance, we expose that it is worth removing affixes.
id UFMG-9_1e5da3d7529ff048ba9d715a9e13dfee
oai_identifier_str oai:periodicos.ufmg.br:article/26469
network_acronym_str UFMG-9
network_name_str Texto livre
repository_id_str
spelling Developing a spell checkerDesenvolvimento de um corretor ortográficoCorretor OrtográficoOrtografiaAfixosLinguística ComputacionalSpell CheckeSpellingOrthographyAffixesComputational LinguisticsSpell checkers are ubiquitous computational tools that help us in correctly writing texts or messages andimproving information inquiry and data mining. The present work presents the history of development of spellcheckers and illustrates how, in a simple way, it is possible to create an efficient spell checker from Norvig’sproposal. We also highlight some tools and how they are used in the development of spell checkers, such asaffix removal and n-gram computation. Moreover, we present an implementation of Norvig’s spell checkerand its performance in automatic correction for different spelling error data sets. Also, in a comparison ofspell checkers performance, we expose that it is worth removing affixes.Corretores ortográficos são ferramentas computacionais utilizadas cotidianamente na redação de textos e demensagens ou, de forma oculta, na busca por informação e mineração de dados. Diante de sua relevância,o presente trabalho apresenta o percurso histórico de desenvolvimento dos corretores ortográficos e ilustracomo, de forma simples, é possível criar um corretor ortográfico eficiente a partir da proposta de Norvig (2007). Salientam-se, também, algumas ferramentas e as estratégias empregadas na elaboração de corretores,como a remoção de afixos e a computação de n-gramas. Explicita-se, ainda, a implementação do corretorortográfico de Norvig (2007) e verifica-se seu desempenho na tarefa de correção automática em diferentesconjuntos de dados de erros ortográficos. Expõe-se, também, uma comparação na performance de um corretorortográfico que se vale da remoção de afixos em relação a um corretor que não adota semelhante estratégia.Universidade Federal de Minas Gerais2021-02-09info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.ufmg.br/index.php/textolivre/article/view/2646910.35699/1983-3652.2021.26469Texto Livre; Vol. 14 No. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469Texto Livre; Vol. 14 Núm. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469Texto Livre; Vol. 14 No 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469Texto Livre; v. 14 n. 1 (2021): Texto Livre: Linguagem e Tecnologia; e264691983-3652reponame:Texto livreinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGporhttps://periodicos.ufmg.br/index.php/textolivre/article/view/26469/23211Copyright (c) 2020 Texto Livre: Linguagem e Tecnologiahttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessAraujo, Leonardo Carneiro deBenevides, Aline de LimaSansão, João Pedro Hallack2022-04-12T19:27:27Zoai:periodicos.ufmg.br:article/26469Revistahttp://www.periodicos.letras.ufmg.br/index.php/textolivrePUBhttps://periodicos.ufmg.br/index.php/textolivre/oairevistatextolivre@letras.ufmg.br1983-36521983-3652opendoar:2022-04-12T19:27:27Texto livre - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv Developing a spell checker
Desenvolvimento de um corretor ortográfico
title Developing a spell checker
spellingShingle Developing a spell checker
Araujo, Leonardo Carneiro de
Corretor Ortográfico
Ortografia
Afixos
Linguística Computacional
Spell Checke
Spelling
Orthography
Affixes
Computational Linguistics
title_short Developing a spell checker
title_full Developing a spell checker
title_fullStr Developing a spell checker
title_full_unstemmed Developing a spell checker
title_sort Developing a spell checker
author Araujo, Leonardo Carneiro de
author_facet Araujo, Leonardo Carneiro de
Benevides, Aline de Lima
Sansão, João Pedro Hallack
author_role author
author2 Benevides, Aline de Lima
Sansão, João Pedro Hallack
author2_role author
author
dc.contributor.author.fl_str_mv Araujo, Leonardo Carneiro de
Benevides, Aline de Lima
Sansão, João Pedro Hallack
dc.subject.por.fl_str_mv Corretor Ortográfico
Ortografia
Afixos
Linguística Computacional
Spell Checke
Spelling
Orthography
Affixes
Computational Linguistics
topic Corretor Ortográfico
Ortografia
Afixos
Linguística Computacional
Spell Checke
Spelling
Orthography
Affixes
Computational Linguistics
description Spell checkers are ubiquitous computational tools that help us in correctly writing texts or messages andimproving information inquiry and data mining. The present work presents the history of development of spellcheckers and illustrates how, in a simple way, it is possible to create an efficient spell checker from Norvig’sproposal. We also highlight some tools and how they are used in the development of spell checkers, such asaffix removal and n-gram computation. Moreover, we present an implementation of Norvig’s spell checkerand its performance in automatic correction for different spelling error data sets. Also, in a comparison ofspell checkers performance, we expose that it is worth removing affixes.
publishDate 2021
dc.date.none.fl_str_mv 2021-02-09
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.ufmg.br/index.php/textolivre/article/view/26469
10.35699/1983-3652.2021.26469
url https://periodicos.ufmg.br/index.php/textolivre/article/view/26469
identifier_str_mv 10.35699/1983-3652.2021.26469
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.ufmg.br/index.php/textolivre/article/view/26469/23211
dc.rights.driver.fl_str_mv Copyright (c) 2020 Texto Livre: Linguagem e Tecnologia
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2020 Texto Livre: Linguagem e Tecnologia
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv Texto Livre; Vol. 14 No. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469
Texto Livre; Vol. 14 Núm. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469
Texto Livre; Vol. 14 No 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469
Texto Livre; v. 14 n. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469
1983-3652
reponame:Texto livre
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Texto livre
collection Texto livre
repository.name.fl_str_mv Texto livre - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv revistatextolivre@letras.ufmg.br
_version_ 1799711143389822976