Developing a spell checker
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Texto livre |
Texto Completo: | https://periodicos.ufmg.br/index.php/textolivre/article/view/26469 |
Resumo: | Spell checkers are ubiquitous computational tools that help us in correctly writing texts or messages andimproving information inquiry and data mining. The present work presents the history of development of spellcheckers and illustrates how, in a simple way, it is possible to create an efficient spell checker from Norvig’sproposal. We also highlight some tools and how they are used in the development of spell checkers, such asaffix removal and n-gram computation. Moreover, we present an implementation of Norvig’s spell checkerand its performance in automatic correction for different spelling error data sets. Also, in a comparison ofspell checkers performance, we expose that it is worth removing affixes. |
id |
UFMG-9_1e5da3d7529ff048ba9d715a9e13dfee |
---|---|
oai_identifier_str |
oai:periodicos.ufmg.br:article/26469 |
network_acronym_str |
UFMG-9 |
network_name_str |
Texto livre |
repository_id_str |
|
spelling |
Developing a spell checkerDesenvolvimento de um corretor ortográficoCorretor OrtográficoOrtografiaAfixosLinguística ComputacionalSpell CheckeSpellingOrthographyAffixesComputational LinguisticsSpell checkers are ubiquitous computational tools that help us in correctly writing texts or messages andimproving information inquiry and data mining. The present work presents the history of development of spellcheckers and illustrates how, in a simple way, it is possible to create an efficient spell checker from Norvig’sproposal. We also highlight some tools and how they are used in the development of spell checkers, such asaffix removal and n-gram computation. Moreover, we present an implementation of Norvig’s spell checkerand its performance in automatic correction for different spelling error data sets. Also, in a comparison ofspell checkers performance, we expose that it is worth removing affixes.Corretores ortográficos são ferramentas computacionais utilizadas cotidianamente na redação de textos e demensagens ou, de forma oculta, na busca por informação e mineração de dados. Diante de sua relevância,o presente trabalho apresenta o percurso histórico de desenvolvimento dos corretores ortográficos e ilustracomo, de forma simples, é possível criar um corretor ortográfico eficiente a partir da proposta de Norvig (2007). Salientam-se, também, algumas ferramentas e as estratégias empregadas na elaboração de corretores,como a remoção de afixos e a computação de n-gramas. Explicita-se, ainda, a implementação do corretorortográfico de Norvig (2007) e verifica-se seu desempenho na tarefa de correção automática em diferentesconjuntos de dados de erros ortográficos. Expõe-se, também, uma comparação na performance de um corretorortográfico que se vale da remoção de afixos em relação a um corretor que não adota semelhante estratégia.Universidade Federal de Minas Gerais2021-02-09info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.ufmg.br/index.php/textolivre/article/view/2646910.35699/1983-3652.2021.26469Texto Livre; Vol. 14 No. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469Texto Livre; Vol. 14 Núm. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469Texto Livre; Vol. 14 No 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469Texto Livre; v. 14 n. 1 (2021): Texto Livre: Linguagem e Tecnologia; e264691983-3652reponame:Texto livreinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGporhttps://periodicos.ufmg.br/index.php/textolivre/article/view/26469/23211Copyright (c) 2020 Texto Livre: Linguagem e Tecnologiahttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessAraujo, Leonardo Carneiro deBenevides, Aline de LimaSansão, João Pedro Hallack2022-04-12T19:27:27Zoai:periodicos.ufmg.br:article/26469Revistahttp://www.periodicos.letras.ufmg.br/index.php/textolivrePUBhttps://periodicos.ufmg.br/index.php/textolivre/oairevistatextolivre@letras.ufmg.br1983-36521983-3652opendoar:2022-04-12T19:27:27Texto livre - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.none.fl_str_mv |
Developing a spell checker Desenvolvimento de um corretor ortográfico |
title |
Developing a spell checker |
spellingShingle |
Developing a spell checker Araujo, Leonardo Carneiro de Corretor Ortográfico Ortografia Afixos Linguística Computacional Spell Checke Spelling Orthography Affixes Computational Linguistics |
title_short |
Developing a spell checker |
title_full |
Developing a spell checker |
title_fullStr |
Developing a spell checker |
title_full_unstemmed |
Developing a spell checker |
title_sort |
Developing a spell checker |
author |
Araujo, Leonardo Carneiro de |
author_facet |
Araujo, Leonardo Carneiro de Benevides, Aline de Lima Sansão, João Pedro Hallack |
author_role |
author |
author2 |
Benevides, Aline de Lima Sansão, João Pedro Hallack |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Araujo, Leonardo Carneiro de Benevides, Aline de Lima Sansão, João Pedro Hallack |
dc.subject.por.fl_str_mv |
Corretor Ortográfico Ortografia Afixos Linguística Computacional Spell Checke Spelling Orthography Affixes Computational Linguistics |
topic |
Corretor Ortográfico Ortografia Afixos Linguística Computacional Spell Checke Spelling Orthography Affixes Computational Linguistics |
description |
Spell checkers are ubiquitous computational tools that help us in correctly writing texts or messages andimproving information inquiry and data mining. The present work presents the history of development of spellcheckers and illustrates how, in a simple way, it is possible to create an efficient spell checker from Norvig’sproposal. We also highlight some tools and how they are used in the development of spell checkers, such asaffix removal and n-gram computation. Moreover, we present an implementation of Norvig’s spell checkerand its performance in automatic correction for different spelling error data sets. Also, in a comparison ofspell checkers performance, we expose that it is worth removing affixes. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-02-09 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.ufmg.br/index.php/textolivre/article/view/26469 10.35699/1983-3652.2021.26469 |
url |
https://periodicos.ufmg.br/index.php/textolivre/article/view/26469 |
identifier_str_mv |
10.35699/1983-3652.2021.26469 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.ufmg.br/index.php/textolivre/article/view/26469/23211 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2020 Texto Livre: Linguagem e Tecnologia https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2020 Texto Livre: Linguagem e Tecnologia https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
Texto Livre; Vol. 14 No. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469 Texto Livre; Vol. 14 Núm. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469 Texto Livre; Vol. 14 No 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469 Texto Livre; v. 14 n. 1 (2021): Texto Livre: Linguagem e Tecnologia; e26469 1983-3652 reponame:Texto livre instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Texto livre |
collection |
Texto livre |
repository.name.fl_str_mv |
Texto livre - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
revistatextolivre@letras.ufmg.br |
_version_ |
1799711143389822976 |