Malware detection in android applications with machine learning techniques
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.21/16978 |
Resumo: | Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores |
id |
RCAP_c1f0ca3997410d0d6590ac740261f9bc |
---|---|
oai_identifier_str |
oai:repositorio.ipl.pt:10400.21/16978 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Malware detection in android applications with machine learning techniquesAplicações androidAprendizagem automáticaAprendizagem supervisionadaConjuntos de dadosDeteção de malwareSegurançaSeleção de atributosAndroid applicationsDatasetsFeature selectionMachine learningMalware detectionSecurityDissertação para obtenção do Grau de Mestre em Engenharia Informática e de ComputadoresA presença de software malicioso (malware) em, por exemplo, aplicações Android, tem consequências prejudiciais e irreparáveis para o utilizador e/ou o dispositivo. Apesar das app stores providenciarem proteções para restringir aplicações contendo malware, este continua a crescer em sofisticação e difusão. Neste trabalho, exploramos técnicas de Aprendizagem Automática (AA) para deteção de malware em aplicações Android. Com foco no estudo de diferentes técnicas de pré-processamento, redução de dimensionalidade e classificação, avaliando a capacidade de generalização do modelo usando conjuntos de dados standard e de domínio público. Com base na literatura e nos nossos resultados experimentais, concluímos que os classificadores que apresentam melhor desempenho na deteção de malware em aplicações Android são Support Vector Machine (SVM) e Random Forest (RF). É dado ênfase à Seleção de Atributos (SA), que reduz a dimensionalidade dos dados e identifica os atributos mais decisivos para classificação de malware em Android. Aplicam-se diferentes métricas de avaliação ao modelo e comparam-se os resultados experimentais com os reportados na literatura. O objetivo deste estudo é o desenvolvimento de um protótipo que recorra a técnicas de AA para detetar malware em aplicações Android. A nossa abordagem é capaz de identificar os atributos mais relevantes para classificar uma aplicação como maliciosa. Nomeadamente, concluímos que as permissões se destacam na deteção de malware em Android. A abordagem proposta reduz a imensionalidade dos dados enquanto apresenta uma alta acurácia na identificação de malware em aplicações Android.MFSPV outperforms DLAPP in computational efficiency, but DLAPP achieves a slightly lower network latency. Nevertheless, both only introduce an additional 11% delay in hybrid end-to-end communications. Hybrid communication imposes, on average, an extra 28.29ms of end-to-end time. The proposal shows promise as it reaches end-to-end times below the latency requirements imposed in most C-ITS use cases.The presence of malicious software (malware), for example, in Android applications (apps), has harmful or irreparable consequences to the user and/or the device. Despite the protections app stores provide to restrict apps containing malware, it keeps growing both in sophistication and diffusion. In this work, we explore the use of Machine Learning (ML) techniques to detect malware in Android apps. The focus is on the study of different data pre-processing, dimensionality reduction, and classification techniques, assessing the generalisation ability of the learned models using standard and public domain datasets. From the literature and our own experimental results, it can be concluded that the classifiers that achieve the best performance in Android malware detection are the Support Vector Machine (SVM) and Random Forest (RF). We also emphasise Feature Selection (FS), which reduces the data’s dimensionality and identifies the most relevant features in Android malware classification. Different evaluationmetrics are applied to the learned model and compared against the experimental results found in the literature.The final goal of this study was the development of a prototype that resorts to ML techniques to detect malware in Android apps. Our approach is able to identify the most relevant features to classify an app as malicious. Namely, we conclude that permissions play a prominent role in Androidmalware detection. The proposed approach reduced the data dimensionality while achieving high accuracy in identifying malware in Android apps.Ferreira, Artur JorgeRCIPLPalma, Catarina Rodrigues2024-01-24T11:36:24Z20232023-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.21/16978TID:203446844engPalma, Catarina Rodrigues- Malware detection in android applications with machine learning techniques. Lisboa: Instituto Superior de Engenharia de Lisboa, 2023. Dissertação de Mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-31T02:16:13Zoai:repositorio.ipl.pt:10400.21/16978Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:59:13.540682Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Malware detection in android applications with machine learning techniques |
title |
Malware detection in android applications with machine learning techniques |
spellingShingle |
Malware detection in android applications with machine learning techniques Palma, Catarina Rodrigues Aplicações android Aprendizagem automática Aprendizagem supervisionada Conjuntos de dados Deteção de malware Segurança Seleção de atributos Android applications Datasets Feature selection Machine learning Malware detection Security |
title_short |
Malware detection in android applications with machine learning techniques |
title_full |
Malware detection in android applications with machine learning techniques |
title_fullStr |
Malware detection in android applications with machine learning techniques |
title_full_unstemmed |
Malware detection in android applications with machine learning techniques |
title_sort |
Malware detection in android applications with machine learning techniques |
author |
Palma, Catarina Rodrigues |
author_facet |
Palma, Catarina Rodrigues |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ferreira, Artur Jorge RCIPL |
dc.contributor.author.fl_str_mv |
Palma, Catarina Rodrigues |
dc.subject.por.fl_str_mv |
Aplicações android Aprendizagem automática Aprendizagem supervisionada Conjuntos de dados Deteção de malware Segurança Seleção de atributos Android applications Datasets Feature selection Machine learning Malware detection Security |
topic |
Aplicações android Aprendizagem automática Aprendizagem supervisionada Conjuntos de dados Deteção de malware Segurança Seleção de atributos Android applications Datasets Feature selection Machine learning Malware detection Security |
description |
Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023 2023-01-01T00:00:00Z 2024-01-24T11:36:24Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.21/16978 TID:203446844 |
url |
http://hdl.handle.net/10400.21/16978 |
identifier_str_mv |
TID:203446844 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Palma, Catarina Rodrigues- Malware detection in android applications with machine learning techniques. Lisboa: Instituto Superior de Engenharia de Lisboa, 2023. Dissertação de Mestrado |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137076124319744 |