MDLText aplicado na filtragem automática de SPIM e SMS spam

Detalhes bibliográficos
Autor(a) principal: Silva, Renato Moraes, 1988-
Data de Publicação: 2018
Outros Autores: Yamakami, Akebo, 1947-
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório da Produção Científica e Intelectual da Unicamp
Texto Completo: https://hdl.handle.net/20.500.12733/1651921
Resumo: Agradecimentos: Os autores são gratos à CAPES (Proc. 1709642) e CNPq (Proc. 141089/2013-0) pelo apoio financeiro concedido ao desenvolvimento desse projeto
id CAMP_d4f55a0ee672d704fe513bb48dfc16d0
oai_identifier_str oai:https://www.repositorio.unicamp.br/:1190106
network_acronym_str CAMP
network_name_str Repositório da Produção Científica e Intelectual da Unicamp
repository_id_str
spelling MDLText aplicado na filtragem automática de SPIM e SMS spamMDLTextapplied to automatic filtering of SPIM andSMS spamAprendizado de máquinaOccam (Linguagem de programação de computador)Occam (Computer program language)Machine learningAprendizado onlineCategorização de textoArtigo originalAgradecimentos: Os autores são gratos à CAPES (Proc. 1709642) e CNPq (Proc. 141089/2013-0) pelo apoio financeiro concedido ao desenvolvimento desse projetoA filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrentar esse problema, neste artigo é avaliado um método de classificação de texto baseado no princípio da descrição mais simples, que é eficiente, rápido, escalável, multiclasse e possui aprendizado incremental. Experimentos realizados com uma base de dados real e pública, em cenários de aprendizado online e offline, indicam que o método proposto é promissor para a tarefa de detecção de spam em mensagens instantâneas e SMSSpam filtering in online instant messages and SMS is a challengingproblem nowadays. It is because the messages are often very short and rife withslangs, idioms, symbols, emoticons, and abbreviations which hamper predictingand knowledge discovering. In order to face this problem, we evaluated a sim-ple, fast, scalable, multiclass, and online text classification method based on theminimum description length principle. We conducted experiments using a realand public dataset, which demonstrate that our method is effective on instantmessaging and SMS spam filtering in both online and offline learning contextsCONSELHO NACIONAL DE DESENVOLVIMENTO CIENTÍFICO E TECNOLÓGICO - CNPQCOORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR - CAPESAbertoUNIVERSIDADE ESTADUAL DE CAMPINASSilva, Renato Moraes, 1988-Yamakami, Akebo, 1947-2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://hdl.handle.net/20.500.12733/1651921SILVA, Renato Moraes; YAMAKAMI, Akebo. MDLText aplicado na filtragem automática de SPIM e SMS spam. ISYS: revista brasileira de sistemas de informação. Porto Alegre, RS : Sociedade Brasileira de Computação, 2018.. Vol. 11, no. 1 (2018), p. 103-132. Disponível em: https://hdl.handle.net/20.500.12733/1651921. Acesso em: 7 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1190106porreponame:Repositório da Produção Científica e Intelectual da Unicampinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-10-18T11:38:37Zoai:https://www.repositorio.unicamp.br/:1190106Repositório InstitucionalPUBhttp://repositorio.unicamp.br/oai/requestreposip@unicamp.bropendoar:2023-10-18T11:38:37Repositório da Produção Científica e Intelectual da Unicamp - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv MDLText aplicado na filtragem automática de SPIM e SMS spam
MDLTextapplied to automatic filtering of SPIM andSMS spam
title MDLText aplicado na filtragem automática de SPIM e SMS spam
spellingShingle MDLText aplicado na filtragem automática de SPIM e SMS spam
Silva, Renato Moraes, 1988-
Aprendizado de máquina
Occam (Linguagem de programação de computador)
Occam (Computer program language)
Machine learning
Aprendizado online
Categorização de texto
Artigo original
title_short MDLText aplicado na filtragem automática de SPIM e SMS spam
title_full MDLText aplicado na filtragem automática de SPIM e SMS spam
title_fullStr MDLText aplicado na filtragem automática de SPIM e SMS spam
title_full_unstemmed MDLText aplicado na filtragem automática de SPIM e SMS spam
title_sort MDLText aplicado na filtragem automática de SPIM e SMS spam
author Silva, Renato Moraes, 1988-
author_facet Silva, Renato Moraes, 1988-
Yamakami, Akebo, 1947-
author_role author
author2 Yamakami, Akebo, 1947-
author2_role author
dc.contributor.none.fl_str_mv UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Silva, Renato Moraes, 1988-
Yamakami, Akebo, 1947-
dc.subject.por.fl_str_mv Aprendizado de máquina
Occam (Linguagem de programação de computador)
Occam (Computer program language)
Machine learning
Aprendizado online
Categorização de texto
Artigo original
topic Aprendizado de máquina
Occam (Linguagem de programação de computador)
Occam (Computer program language)
Machine learning
Aprendizado online
Categorização de texto
Artigo original
description Agradecimentos: Os autores são gratos à CAPES (Proc. 1709642) e CNPq (Proc. 141089/2013-0) pelo apoio financeiro concedido ao desenvolvimento desse projeto
publishDate 2018
dc.date.none.fl_str_mv 2018
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1651921
SILVA, Renato Moraes; YAMAKAMI, Akebo. MDLText aplicado na filtragem automática de SPIM e SMS spam. ISYS: revista brasileira de sistemas de informação. Porto Alegre, RS : Sociedade Brasileira de Computação, 2018.. Vol. 11, no. 1 (2018), p. 103-132. Disponível em: https://hdl.handle.net/20.500.12733/1651921. Acesso em: 7 mai. 2024.
url https://hdl.handle.net/20.500.12733/1651921
identifier_str_mv SILVA, Renato Moraes; YAMAKAMI, Akebo. MDLText aplicado na filtragem automática de SPIM e SMS spam. ISYS: revista brasileira de sistemas de informação. Porto Alegre, RS : Sociedade Brasileira de Computação, 2018.. Vol. 11, no. 1 (2018), p. 103-132. Disponível em: https://hdl.handle.net/20.500.12733/1651921. Acesso em: 7 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1190106
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório da Produção Científica e Intelectual da Unicamp
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Repositório da Produção Científica e Intelectual da Unicamp
collection Repositório da Produção Científica e Intelectual da Unicamp
repository.name.fl_str_mv Repositório da Produção Científica e Intelectual da Unicamp - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv reposip@unicamp.br
_version_ 1799030821451988992