Plataforma para análise de fugas de informação na World Wide Web

Detalhes bibliográficos
Autor(a) principal: Sousa, Vítor Hugo Silva
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10071/12742
Resumo: A World Wide Web e a Deep Web são hoje em dia os principais focos de exposi- ção e alojamento de informação corporativa confidencial. Adicionalmente, muitos dos sistemas de informação das organizações estão comprometidos, sendo muitas vezes possível recorrer a serviços online para verificar a existência de vulnerabilidades e exposição de serviços/informação que potencialmente possam colocar a organização em risco. Hoje em dia, indivíduos e empresas enfrentam problemas sérios de perdas de dados e informação que podem ser posteriormente revelados e utilizados para fins maliciosos. Na maioria dos casos, as organizações são reativas e não pro-ativas face a fugas de informação e à análise dos dados da infraestrutura que estão expostos em múltiplos serviços na WWW. Com base neste problema foi desenvolvida uma plataforma que pretende atenuar este problema. Numa primeira abordagem foram feitas pesquisas sobre a técnicas de monitorização e extração da informação presente na World Wide Web através de Web Crawlers ou Web Scrappers. Foram ainda analisadas algumas plataformas de Data Loss Prevention comparando-as com a plataforma desenvolvida e as tecnologias de Big Data existentes. Foi estruturada e desenvolvida uma plataforma Web-based que permite aos seus utilizadores a procura automática de informação corporativa na Web, que possa estar publicamente disponível, de forma não-autorizada em múltiplos serviços online. A utilidade desta plataforma foca-se na procura de informação pessoal ou corporativa através de termos definidos pelo utilizador em duas plataformas distintas, o Pastebin (http://pastebin.com ) e o Shodan (https://www.shodan.io/). Por fim a plataforma foi disponibilizada online e foram convidados especialistas da área da segurança de informação. Das respostas dos utilizadores registados foram extraídos dados sob forma de questionário para validar questões de funcionalidade da plataforma. Foram ainda feitos testes de validação de fugas de informação controlados durante cerca de 6 meses validando que existem de fato imensas fugas de informação presentes na Word Wide Web.
id RCAP_01dbe34bf51247f9a7f1b5f78766574c
oai_identifier_str oai:repositorio.iscte-iul.pt:10071/12742
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Plataforma para análise de fugas de informação na World Wide WebWWWWWW -- World wide webMonitorizaçãoSegurança da informaçãoData LeakageConfidentialityBig dataA World Wide Web e a Deep Web são hoje em dia os principais focos de exposi- ção e alojamento de informação corporativa confidencial. Adicionalmente, muitos dos sistemas de informação das organizações estão comprometidos, sendo muitas vezes possível recorrer a serviços online para verificar a existência de vulnerabilidades e exposição de serviços/informação que potencialmente possam colocar a organização em risco. Hoje em dia, indivíduos e empresas enfrentam problemas sérios de perdas de dados e informação que podem ser posteriormente revelados e utilizados para fins maliciosos. Na maioria dos casos, as organizações são reativas e não pro-ativas face a fugas de informação e à análise dos dados da infraestrutura que estão expostos em múltiplos serviços na WWW. Com base neste problema foi desenvolvida uma plataforma que pretende atenuar este problema. Numa primeira abordagem foram feitas pesquisas sobre a técnicas de monitorização e extração da informação presente na World Wide Web através de Web Crawlers ou Web Scrappers. Foram ainda analisadas algumas plataformas de Data Loss Prevention comparando-as com a plataforma desenvolvida e as tecnologias de Big Data existentes. Foi estruturada e desenvolvida uma plataforma Web-based que permite aos seus utilizadores a procura automática de informação corporativa na Web, que possa estar publicamente disponível, de forma não-autorizada em múltiplos serviços online. A utilidade desta plataforma foca-se na procura de informação pessoal ou corporativa através de termos definidos pelo utilizador em duas plataformas distintas, o Pastebin (http://pastebin.com ) e o Shodan (https://www.shodan.io/). Por fim a plataforma foi disponibilizada online e foram convidados especialistas da área da segurança de informação. Das respostas dos utilizadores registados foram extraídos dados sob forma de questionário para validar questões de funcionalidade da plataforma. Foram ainda feitos testes de validação de fugas de informação controlados durante cerca de 6 meses validando que existem de fato imensas fugas de informação presentes na Word Wide Web.The World Wide Web and the Deep Web are today the main focus for exposing and hosting confidential corporate information. Adicionally, many of these coporate information systems are compromised, being easy to resort to online services to check the existence of vulnerabilites and exhibition services/information that could potentially put the organization at risk. Nowadays individuals and businesses face serious problems of data loss and information that can later be disclosed and used for malicious purposes. In most cases, organizations are reactive and not proactive against information leakage and analysis of the data infrastructure that are exposed in multiple services on the World Wide Web. Based on this problem we have developed a platform that aims to overcome this problem. In a first approach we researched about monitoring and extraction tecnhiques of the information that was present on the World Wide Web through Web Crawlers or Web Scrappers. There where also analyzed some Data Loss Prevention platforms comparing them with the developed platform and we analysed existing Big Data technologies. It was strutured and developed a Web-base platform that allows users to automatically search for corporate information on the web, that may be publicly available in an non-athorized manner in multiple online services. The utility of this platform is focused on finding personal or corporate information through the terms defined by the user on two different platforms, the Pastebin (http://pastebin.com) and Shodan (https://www.shodan.io/). Finally the platform was made available online and there have been invited experts of the information security area. From the responses in the questionnaire form of the registered users data was extracted to validate the platform functionality issues. There were also done information leakage validation tests monitored for approximately 6 months validating that there are indeed lots of information leakage present in the Word Wide Web.2017-04-04T14:59:35Z2016-11-29T00:00:00Z2016-11-292016-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/octet-streamhttp://hdl.handle.net/10071/12742TID:201541904porSousa, Vítor Hugo Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T17:59:54Zoai:repositorio.iscte-iul.pt:10071/12742Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:31:35.476435Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Plataforma para análise de fugas de informação na World Wide Web
title Plataforma para análise de fugas de informação na World Wide Web
spellingShingle Plataforma para análise de fugas de informação na World Wide Web
Sousa, Vítor Hugo Silva
WWWWWW -- World wide web
Monitorização
Segurança da informação
Data Leakage
Confidentiality
Big data
title_short Plataforma para análise de fugas de informação na World Wide Web
title_full Plataforma para análise de fugas de informação na World Wide Web
title_fullStr Plataforma para análise de fugas de informação na World Wide Web
title_full_unstemmed Plataforma para análise de fugas de informação na World Wide Web
title_sort Plataforma para análise de fugas de informação na World Wide Web
author Sousa, Vítor Hugo Silva
author_facet Sousa, Vítor Hugo Silva
author_role author
dc.contributor.author.fl_str_mv Sousa, Vítor Hugo Silva
dc.subject.por.fl_str_mv WWWWWW -- World wide web
Monitorização
Segurança da informação
Data Leakage
Confidentiality
Big data
topic WWWWWW -- World wide web
Monitorização
Segurança da informação
Data Leakage
Confidentiality
Big data
description A World Wide Web e a Deep Web são hoje em dia os principais focos de exposi- ção e alojamento de informação corporativa confidencial. Adicionalmente, muitos dos sistemas de informação das organizações estão comprometidos, sendo muitas vezes possível recorrer a serviços online para verificar a existência de vulnerabilidades e exposição de serviços/informação que potencialmente possam colocar a organização em risco. Hoje em dia, indivíduos e empresas enfrentam problemas sérios de perdas de dados e informação que podem ser posteriormente revelados e utilizados para fins maliciosos. Na maioria dos casos, as organizações são reativas e não pro-ativas face a fugas de informação e à análise dos dados da infraestrutura que estão expostos em múltiplos serviços na WWW. Com base neste problema foi desenvolvida uma plataforma que pretende atenuar este problema. Numa primeira abordagem foram feitas pesquisas sobre a técnicas de monitorização e extração da informação presente na World Wide Web através de Web Crawlers ou Web Scrappers. Foram ainda analisadas algumas plataformas de Data Loss Prevention comparando-as com a plataforma desenvolvida e as tecnologias de Big Data existentes. Foi estruturada e desenvolvida uma plataforma Web-based que permite aos seus utilizadores a procura automática de informação corporativa na Web, que possa estar publicamente disponível, de forma não-autorizada em múltiplos serviços online. A utilidade desta plataforma foca-se na procura de informação pessoal ou corporativa através de termos definidos pelo utilizador em duas plataformas distintas, o Pastebin (http://pastebin.com ) e o Shodan (https://www.shodan.io/). Por fim a plataforma foi disponibilizada online e foram convidados especialistas da área da segurança de informação. Das respostas dos utilizadores registados foram extraídos dados sob forma de questionário para validar questões de funcionalidade da plataforma. Foram ainda feitos testes de validação de fugas de informação controlados durante cerca de 6 meses validando que existem de fato imensas fugas de informação presentes na Word Wide Web.
publishDate 2016
dc.date.none.fl_str_mv 2016-11-29T00:00:00Z
2016-11-29
2016-09
2017-04-04T14:59:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10071/12742
TID:201541904
url http://hdl.handle.net/10071/12742
identifier_str_mv TID:201541904
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/octet-stream
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134877222699008