MDLText aplicado na filtragem automática de SPIM e SMS spam
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório da Produção Científica e Intelectual da Unicamp |
Texto Completo: | https://hdl.handle.net/20.500.12733/1651921 |
Resumo: | Agradecimentos: Os autores são gratos à CAPES (Proc. 1709642) e CNPq (Proc. 141089/2013-0) pelo apoio financeiro concedido ao desenvolvimento desse projeto |
id |
CAMP_d4f55a0ee672d704fe513bb48dfc16d0 |
---|---|
oai_identifier_str |
oai:https://www.repositorio.unicamp.br/:1190106 |
network_acronym_str |
CAMP |
network_name_str |
Repositório da Produção Científica e Intelectual da Unicamp |
repository_id_str |
|
spelling |
MDLText aplicado na filtragem automática de SPIM e SMS spamMDLTextapplied to automatic filtering of SPIM andSMS spamAprendizado de máquinaOccam (Linguagem de programação de computador)Occam (Computer program language)Machine learningAprendizado onlineCategorização de textoArtigo originalAgradecimentos: Os autores são gratos à CAPES (Proc. 1709642) e CNPq (Proc. 141089/2013-0) pelo apoio financeiro concedido ao desenvolvimento desse projetoA filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrentar esse problema, neste artigo é avaliado um método de classificação de texto baseado no princípio da descrição mais simples, que é eficiente, rápido, escalável, multiclasse e possui aprendizado incremental. Experimentos realizados com uma base de dados real e pública, em cenários de aprendizado online e offline, indicam que o método proposto é promissor para a tarefa de detecção de spam em mensagens instantâneas e SMSSpam filtering in online instant messages and SMS is a challengingproblem nowadays. It is because the messages are often very short and rife withslangs, idioms, symbols, emoticons, and abbreviations which hamper predictingand knowledge discovering. In order to face this problem, we evaluated a sim-ple, fast, scalable, multiclass, and online text classification method based on theminimum description length principle. We conducted experiments using a realand public dataset, which demonstrate that our method is effective on instantmessaging and SMS spam filtering in both online and offline learning contextsCONSELHO NACIONAL DE DESENVOLVIMENTO CIENTÍFICO E TECNOLÓGICO - CNPQCOORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR - CAPESAbertoUNIVERSIDADE ESTADUAL DE CAMPINASSilva, Renato Moraes, 1988-Yamakami, Akebo, 1947-2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://hdl.handle.net/20.500.12733/1651921SILVA, Renato Moraes; YAMAKAMI, Akebo. MDLText aplicado na filtragem automática de SPIM e SMS spam. ISYS: revista brasileira de sistemas de informação. Porto Alegre, RS : Sociedade Brasileira de Computação, 2018.. Vol. 11, no. 1 (2018), p. 103-132. Disponível em: https://hdl.handle.net/20.500.12733/1651921. Acesso em: 7 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1190106porreponame:Repositório da Produção Científica e Intelectual da Unicampinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-10-18T11:38:37Zoai:https://www.repositorio.unicamp.br/:1190106Repositório InstitucionalPUBhttp://repositorio.unicamp.br/oai/requestreposip@unicamp.bropendoar:2023-10-18T11:38:37Repositório da Produção Científica e Intelectual da Unicamp - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
MDLText aplicado na filtragem automática de SPIM e SMS spam MDLTextapplied to automatic filtering of SPIM andSMS spam |
title |
MDLText aplicado na filtragem automática de SPIM e SMS spam |
spellingShingle |
MDLText aplicado na filtragem automática de SPIM e SMS spam Silva, Renato Moraes, 1988- Aprendizado de máquina Occam (Linguagem de programação de computador) Occam (Computer program language) Machine learning Aprendizado online Categorização de texto Artigo original |
title_short |
MDLText aplicado na filtragem automática de SPIM e SMS spam |
title_full |
MDLText aplicado na filtragem automática de SPIM e SMS spam |
title_fullStr |
MDLText aplicado na filtragem automática de SPIM e SMS spam |
title_full_unstemmed |
MDLText aplicado na filtragem automática de SPIM e SMS spam |
title_sort |
MDLText aplicado na filtragem automática de SPIM e SMS spam |
author |
Silva, Renato Moraes, 1988- |
author_facet |
Silva, Renato Moraes, 1988- Yamakami, Akebo, 1947- |
author_role |
author |
author2 |
Yamakami, Akebo, 1947- |
author2_role |
author |
dc.contributor.none.fl_str_mv |
UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Silva, Renato Moraes, 1988- Yamakami, Akebo, 1947- |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Occam (Linguagem de programação de computador) Occam (Computer program language) Machine learning Aprendizado online Categorização de texto Artigo original |
topic |
Aprendizado de máquina Occam (Linguagem de programação de computador) Occam (Computer program language) Machine learning Aprendizado online Categorização de texto Artigo original |
description |
Agradecimentos: Os autores são gratos à CAPES (Proc. 1709642) e CNPq (Proc. 141089/2013-0) pelo apoio financeiro concedido ao desenvolvimento desse projeto |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1651921 SILVA, Renato Moraes; YAMAKAMI, Akebo. MDLText aplicado na filtragem automática de SPIM e SMS spam. ISYS: revista brasileira de sistemas de informação. Porto Alegre, RS : Sociedade Brasileira de Computação, 2018.. Vol. 11, no. 1 (2018), p. 103-132. Disponível em: https://hdl.handle.net/20.500.12733/1651921. Acesso em: 7 mai. 2024. |
url |
https://hdl.handle.net/20.500.12733/1651921 |
identifier_str_mv |
SILVA, Renato Moraes; YAMAKAMI, Akebo. MDLText aplicado na filtragem automática de SPIM e SMS spam. ISYS: revista brasileira de sistemas de informação. Porto Alegre, RS : Sociedade Brasileira de Computação, 2018.. Vol. 11, no. 1 (2018), p. 103-132. Disponível em: https://hdl.handle.net/20.500.12733/1651921. Acesso em: 7 mai. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1190106 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório da Produção Científica e Intelectual da Unicamp instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Repositório da Produção Científica e Intelectual da Unicamp |
collection |
Repositório da Produção Científica e Intelectual da Unicamp |
repository.name.fl_str_mv |
Repositório da Produção Científica e Intelectual da Unicamp - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
reposip@unicamp.br |
_version_ |
1799030821451988992 |