Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina

Detalhes bibliográficos
Autor(a) principal: Costa, Elizangela Santos da
Data de Publicação: 2020
Outros Autores: http://lattes.cnpq.br/3561853279775806
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFAM
Texto Completo: https://tede.ufam.edu.br/handle/tede/7807
Resumo: As informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo assim, verificar a credibilidade das informações disponíveis na Web acaba sendo uma tarefa obrigatória. Dentre as diversas soluções desenvolvidas para detectar se uma página Web pode ser acreditada ou não, as baseadas em aprendizagem de máquina são a mais empregadas. Esta dissertação visa avaliar e definir atributos empregáveis em um futuro modelo de avaliação de credibilidade de páginas Web, por meio da extração de características do conteúdo da página e da rede, com o auxílio de classificadores de aprendizagem de máquina, possibilitando assim maior certeza sobre a credibilidade de páginas Web. Como resultado, esta dissertação concluiu que o classificador Random Forest teve o melhor resultado para avaliação de credibilidade de páginas web com 95.36% de acurácia. Além de disponibilizar um script de extração de atributos, apontou também quais são os atributos mais relevantes e de fácil extração que podem ser obtidos e qualquer URL, para isso utilizou 3 métodos de seleção de atributos: Select kbest, Seleção RFE e Seleção RFECV, no qual este último apresentou o melhor resultado com 95.33% de acurácia.
id UFAM_5490edde169c77aa035b3c55d2c124b0
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/7807
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str 6592
spelling Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de MáquinaSegurança da informaçãoSelect kbestClassificadores de aprendizagem de máquinaSeleção RFECVRandom ForestCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOCredibilidadeAvaliação de credibilidadeWebAtributosAs informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo assim, verificar a credibilidade das informações disponíveis na Web acaba sendo uma tarefa obrigatória. Dentre as diversas soluções desenvolvidas para detectar se uma página Web pode ser acreditada ou não, as baseadas em aprendizagem de máquina são a mais empregadas. Esta dissertação visa avaliar e definir atributos empregáveis em um futuro modelo de avaliação de credibilidade de páginas Web, por meio da extração de características do conteúdo da página e da rede, com o auxílio de classificadores de aprendizagem de máquina, possibilitando assim maior certeza sobre a credibilidade de páginas Web. Como resultado, esta dissertação concluiu que o classificador Random Forest teve o melhor resultado para avaliação de credibilidade de páginas web com 95.36% de acurácia. Além de disponibilizar um script de extração de atributos, apontou também quais são os atributos mais relevantes e de fácil extração que podem ser obtidos e qualquer URL, para isso utilizou 3 métodos de seleção de atributos: Select kbest, Seleção RFE e Seleção RFECV, no qual este último apresentou o melhor resultado com 95.33% de acurácia.Information shared on the Web propagates quickly, whether true or not. Credibility in this context refers to the level of trust a user places subjectively on a Web page. The purpose of reproducing incorrect information is related to several factors such as political manipulation, obtain financial benefits, disseminate malicious defamation, among others. Therefore, verifying the credibility of the information available on the Web ends up being a mandatory task. Among the various techniques developed to detect whether aWeb page can be accredited or not, machine learning is the most used in comparison to the assessment of credibility manually. The purpose of this work is to evaluate and define attributes that can be used in a future model for assessing the credibility of Web pages, by extracting characteristics from the content of the page and the network, with the help of machine learning classifiers, thus enabling greater certainty on the credibility of web pages. As a result, this dissertation concluded that the Random Forest classifier had the best result for assessing the credibility of web pages with 95.36% accuracy. In addition to providing an attribute extraction script, also pointing out which are the most relevant and easy extraction attributes that can be selected for any URL, for that, 3 attribute selection methods are used: Select the best, RFE Selection and Selection RFECV, the last result with 95.33% accuracy.Universidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaFeitosa, Eduardo Luzeirohttp://lattes.cnpq.br/5939944067207881Giusti, Rafaelhttp://lattes.cnpq.br/0613781010575440Santin, Altair Olivohttp://lattes.cnpq.br/9604696592563769Costa, Elizangela Santos dahttp://lattes.cnpq.br/35618532797758062020-06-05T18:41:08Z2020-05-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfCOSTA, Elizangela Santos da. Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina. 2020. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2020.https://tede.ufam.edu.br/handle/tede/7807porhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2020-06-06T05:03:58Zoai:https://tede.ufam.edu.br/handle/:tede/7807Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922020-06-06T05:03:58Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
title Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
spellingShingle Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
Costa, Elizangela Santos da
Segurança da informação
Select kbest
Classificadores de aprendizagem de máquina
Seleção RFECV
Random Forest
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Credibilidade
Avaliação de credibilidade
Web
Atributos
title_short Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
title_full Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
title_fullStr Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
title_full_unstemmed Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
title_sort Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
author Costa, Elizangela Santos da
author_facet Costa, Elizangela Santos da
http://lattes.cnpq.br/3561853279775806
author_role author
author2 http://lattes.cnpq.br/3561853279775806
author2_role author
dc.contributor.none.fl_str_mv Feitosa, Eduardo Luzeiro
http://lattes.cnpq.br/5939944067207881
Giusti, Rafael
http://lattes.cnpq.br/0613781010575440
Santin, Altair Olivo
http://lattes.cnpq.br/9604696592563769
dc.contributor.author.fl_str_mv Costa, Elizangela Santos da
http://lattes.cnpq.br/3561853279775806
dc.subject.por.fl_str_mv Segurança da informação
Select kbest
Classificadores de aprendizagem de máquina
Seleção RFECV
Random Forest
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Credibilidade
Avaliação de credibilidade
Web
Atributos
topic Segurança da informação
Select kbest
Classificadores de aprendizagem de máquina
Seleção RFECV
Random Forest
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Credibilidade
Avaliação de credibilidade
Web
Atributos
description As informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo assim, verificar a credibilidade das informações disponíveis na Web acaba sendo uma tarefa obrigatória. Dentre as diversas soluções desenvolvidas para detectar se uma página Web pode ser acreditada ou não, as baseadas em aprendizagem de máquina são a mais empregadas. Esta dissertação visa avaliar e definir atributos empregáveis em um futuro modelo de avaliação de credibilidade de páginas Web, por meio da extração de características do conteúdo da página e da rede, com o auxílio de classificadores de aprendizagem de máquina, possibilitando assim maior certeza sobre a credibilidade de páginas Web. Como resultado, esta dissertação concluiu que o classificador Random Forest teve o melhor resultado para avaliação de credibilidade de páginas web com 95.36% de acurácia. Além de disponibilizar um script de extração de atributos, apontou também quais são os atributos mais relevantes e de fácil extração que podem ser obtidos e qualquer URL, para isso utilizou 3 métodos de seleção de atributos: Select kbest, Seleção RFE e Seleção RFECV, no qual este último apresentou o melhor resultado com 95.33% de acurácia.
publishDate 2020
dc.date.none.fl_str_mv 2020-06-05T18:41:08Z
2020-05-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv COSTA, Elizangela Santos da. Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina. 2020. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2020.
https://tede.ufam.edu.br/handle/tede/7807
identifier_str_mv COSTA, Elizangela Santos da. Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina. 2020. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2020.
url https://tede.ufam.edu.br/handle/tede/7807
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1809731998015553536