Malware detection in android applications with machine learning techniques

Detalhes bibliográficos
Autor(a) principal: Palma, Catarina Rodrigues
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.21/16978
Resumo: Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores
id RCAP_c1f0ca3997410d0d6590ac740261f9bc
oai_identifier_str oai:repositorio.ipl.pt:10400.21/16978
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Malware detection in android applications with machine learning techniquesAplicações androidAprendizagem automáticaAprendizagem supervisionadaConjuntos de dadosDeteção de malwareSegurançaSeleção de atributosAndroid applicationsDatasetsFeature selectionMachine learningMalware detectionSecurityDissertação para obtenção do Grau de Mestre em Engenharia Informática e de ComputadoresA presença de software malicioso (malware) em, por exemplo, aplicações Android, tem consequências prejudiciais e irreparáveis para o utilizador e/ou o dispositivo. Apesar das app stores providenciarem proteções para restringir aplicações contendo malware, este continua a crescer em sofisticação e difusão. Neste trabalho, exploramos técnicas de Aprendizagem Automática (AA) para deteção de malware em aplicações Android. Com foco no estudo de diferentes técnicas de pré-processamento, redução de dimensionalidade e classificação, avaliando a capacidade de generalização do modelo usando conjuntos de dados standard e de domínio público. Com base na literatura e nos nossos resultados experimentais, concluímos que os classificadores que apresentam melhor desempenho na deteção de malware em aplicações Android são Support Vector Machine (SVM) e Random Forest (RF). É dado ênfase à Seleção de Atributos (SA), que reduz a dimensionalidade dos dados e identifica os atributos mais decisivos para classificação de malware em Android. Aplicam-se diferentes métricas de avaliação ao modelo e comparam-se os resultados experimentais com os reportados na literatura. O objetivo deste estudo é o desenvolvimento de um protótipo que recorra a técnicas de AA para detetar malware em aplicações Android. A nossa abordagem é capaz de identificar os atributos mais relevantes para classificar uma aplicação como maliciosa. Nomeadamente, concluímos que as permissões se destacam na deteção de malware em Android. A abordagem proposta reduz a imensionalidade dos dados enquanto apresenta uma alta acurácia na identificação de malware em aplicações Android.MFSPV outperforms DLAPP in computational efficiency, but DLAPP achieves a slightly lower network latency. Nevertheless, both only introduce an additional 11% delay in hybrid end-to-end communications. Hybrid communication imposes, on average, an extra 28.29ms of end-to-end time. The proposal shows promise as it reaches end-to-end times below the latency requirements imposed in most C-ITS use cases.The presence of malicious software (malware), for example, in Android applications (apps), has harmful or irreparable consequences to the user and/or the device. Despite the protections app stores provide to restrict apps containing malware, it keeps growing both in sophistication and diffusion. In this work, we explore the use of Machine Learning (ML) techniques to detect malware in Android apps. The focus is on the study of different data pre-processing, dimensionality reduction, and classification techniques, assessing the generalisation ability of the learned models using standard and public domain datasets. From the literature and our own experimental results, it can be concluded that the classifiers that achieve the best performance in Android malware detection are the Support Vector Machine (SVM) and Random Forest (RF). We also emphasise Feature Selection (FS), which reduces the data’s dimensionality and identifies the most relevant features in Android malware classification. Different evaluationmetrics are applied to the learned model and compared against the experimental results found in the literature.The final goal of this study was the development of a prototype that resorts to ML techniques to detect malware in Android apps. Our approach is able to identify the most relevant features to classify an app as malicious. Namely, we conclude that permissions play a prominent role in Androidmalware detection. The proposed approach reduced the data dimensionality while achieving high accuracy in identifying malware in Android apps.Ferreira, Artur JorgeRCIPLPalma, Catarina Rodrigues2024-01-24T11:36:24Z20232023-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.21/16978TID:203446844engPalma, Catarina Rodrigues- Malware detection in android applications with machine learning techniques. Lisboa: Instituto Superior de Engenharia de Lisboa, 2023. Dissertação de Mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-31T02:16:13Zoai:repositorio.ipl.pt:10400.21/16978Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:59:13.540682Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Malware detection in android applications with machine learning techniques
title Malware detection in android applications with machine learning techniques
spellingShingle Malware detection in android applications with machine learning techniques
Palma, Catarina Rodrigues
Aplicações android
Aprendizagem automática
Aprendizagem supervisionada
Conjuntos de dados
Deteção de malware
Segurança
Seleção de atributos
Android applications
Datasets
Feature selection
Machine learning
Malware detection
Security
title_short Malware detection in android applications with machine learning techniques
title_full Malware detection in android applications with machine learning techniques
title_fullStr Malware detection in android applications with machine learning techniques
title_full_unstemmed Malware detection in android applications with machine learning techniques
title_sort Malware detection in android applications with machine learning techniques
author Palma, Catarina Rodrigues
author_facet Palma, Catarina Rodrigues
author_role author
dc.contributor.none.fl_str_mv Ferreira, Artur Jorge
RCIPL
dc.contributor.author.fl_str_mv Palma, Catarina Rodrigues
dc.subject.por.fl_str_mv Aplicações android
Aprendizagem automática
Aprendizagem supervisionada
Conjuntos de dados
Deteção de malware
Segurança
Seleção de atributos
Android applications
Datasets
Feature selection
Machine learning
Malware detection
Security
topic Aplicações android
Aprendizagem automática
Aprendizagem supervisionada
Conjuntos de dados
Deteção de malware
Segurança
Seleção de atributos
Android applications
Datasets
Feature selection
Machine learning
Malware detection
Security
description Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores
publishDate 2023
dc.date.none.fl_str_mv 2023
2023-01-01T00:00:00Z
2024-01-24T11:36:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.21/16978
TID:203446844
url http://hdl.handle.net/10400.21/16978
identifier_str_mv TID:203446844
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Palma, Catarina Rodrigues- Malware detection in android applications with machine learning techniques. Lisboa: Instituto Superior de Engenharia de Lisboa, 2023. Dissertação de Mestrado
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137076124319744