ARAPP: Análisis y Resumen Automático de Políticas de Privacidad

Detalhes bibliográficos
Autor(a) principal: Alfaro, Rodrigo
Data de Publicação: 2023
Outros Autores: Venegas, René, Bronfman, Alan, Valenzuela, Miguel, Riff, Stephanie, Sologuren, Enrique
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.21814/lm.14.2.375
Resumo: Un derecho fundamental de los usuarios de aplicaciones informáticas es que puedan conocer las políticas de privacidad (PP) que tales aplicaciones establecen, en particular es relevante que conozcan acerca del tratamiento que aceptan sobre el uso de sus datos. No obstante, estas PP son muy extensas y escritas en un lenguaje administrativo-jurídico y comercial, lo que dificulta su lectura y comprensión. El objetivo de este artículo es resumir automatizadamente las PP de cinco aplicaciones de redes sociales (Facebook, Twitter, TikTok, Snapchat e Instagram) en español, a través de técnicas extractivas y abstractivas. Para ello se utilizan tres aproximaciones de representación desde el Procesamiento de Lenguaje Natural, estas son: Teoría de Grafos, TF-IDF y Gensim. A partir de ellas, se generan automáticamente 15 resúmenes, los que son evaluados por un experto en derecho, para medir la legibilidad y relevancia en base a 20 preguntas confeccionadas por un estudio de la Universidad de Austin, Texas. Por último, a partir de una clasificación de cada política de privacidad, según distintos factores de riesgos, se comprueba que el método Gensim es el más adecuado para la representación y resumen. Además se identifica a Snapchat como la aplicación que mejor cumple dichosfactores.
id RCAP_c836356d89e6e52a20a412e81a907672
oai_identifier_str oai:linguamatica.com:article/375
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling ARAPP: Análisis y Resumen Automático de Políticas de PrivacidadAnalysis and Automatic Summary of Privacy PoliciesARAPP: Análisis y Resumen Automático de Políticas de PrivacidadAutomatic summarizationprivate policiesrisk factorslegal textsGensimSocial NetworksResumen automáticopolíticas de privacidadfactores de riesgotextos jurídicosGensimRedes Sociales.Un derecho fundamental de los usuarios de aplicaciones informáticas es que puedan conocer las políticas de privacidad (PP) que tales aplicaciones establecen, en particular es relevante que conozcan acerca del tratamiento que aceptan sobre el uso de sus datos. No obstante, estas PP son muy extensas y escritas en un lenguaje administrativo-jurídico y comercial, lo que dificulta su lectura y comprensión. El objetivo de este artículo es resumir automatizadamente las PP de cinco aplicaciones de redes sociales (Facebook, Twitter, TikTok, Snapchat e Instagram) en español, a través de técnicas extractivas y abstractivas. Para ello se utilizan tres aproximaciones de representación desde el Procesamiento de Lenguaje Natural, estas son: Teoría de Grafos, TF-IDF y Gensim. A partir de ellas, se generan automáticamente 15 resúmenes, los que son evaluados por un experto en derecho, para medir la legibilidad y relevancia en base a 20 preguntas confeccionadas por un estudio de la Universidad de Austin, Texas. Por último, a partir de una clasificación de cada política de privacidad, según distintos factores de riesgos, se comprueba que el método Gensim es el más adecuado para la representación y resumen. Además se identifica a Snapchat como la aplicación que mejor cumple dichosfactores.A fundamental right of the users of computer applications is that they can know the privacy policies (PP) that such applications establish. It is particularly relevant that they know about the treatment that they accept regarding the use of their data. However, these PP are very extensive and written in administrative-legal and commercial language, which makes them difficult to read and understand. The aim of this paper is to automatically summarize the PPs of five social network applications (Facebook, Twitter, TikTok, Snapchat and Instagram) in spanish, through extractive and abstractive techniques. For this purpose, three representation approaches from Natural Language Processing are used, these are: Graph Analysis, TF-IDF and Gensim. Fifteen summaries were automatically generated and evaluated in order to measure the readability and relevance, by an expert in law, based on 20 questions prepared by a study of the University of Austin, Texas. Finally, based on a classification of each privacy policy according to different risk factors, the Gensim method is found to be the most suitable for the representation and summarization of the PP`s. The PP of Snapchat is also identified as the application that best meets these risk factors.Un derecho fundamental de los usuarios de aplicaciones informáticas es que puedan conocer las políticas de privacidad (PP) que tales aplicaciones establecen, en particular es relevante que conozcan acerca del tratamiento que aceptan sobre el uso de sus datos. No obstante, estas PP son muy extensas y escritas en un lenguaje administrativo-jurídico y comercial, lo que dificulta su lectura y comprensión. El objetivo de este artículo es resumir automatizadamente las PP de cinco aplicaciones de redes sociales (Facebook, Twitter, TikTok, Snapchat e Instagram) en español, a través de técnicas extractivas y abstractivas. Para ello se utilizan tres aproximaciones de representación desde el Procesamiento de Lenguaje Natural, estas son: Teoría de Grafos, TF-IDF y Gensim. A partir de ellas, se generan automáticamente 15 resúmenes, los que son evaluados por un experto en derecho, para medir la legibilidad y relevancia en base a 20 preguntas confeccionadas por un estudio de la Universidad de Austin, Texas. Por último, a partir de una clasificación de cada política de privacidad, según distintos factores de riesgos, se comprueba que el método Gensim es el más adecuado para la representación y resumen. Además se identifica a Snapchat como la aplicación que mejor cumple dichosfactores.Universidade do Minho e Universidade de Vigo2023-01-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.14.2.375https://doi.org/10.21814/lm.14.2.375Linguamática; Vol. 14 No. 2; 23--35Linguamática; Vol. 14 Núm. 2; 23--35Linguamática; v. 14 n. 2; 23--351647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/375https://linguamatica.com/index.php/linguamatica/article/view/375/486Direitos de Autor (c) 2023 Rodrigo Alfaro, René Venegas, Alan Bronfman, Miguel Valenzuela, Stephanie Riff, Enrique Sologurenhttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessAlfaro, RodrigoVenegas, RenéBronfman, AlanValenzuela, MiguelRiff, StephanieSologuren, Enrique2023-09-08T13:46:45Zoai:linguamatica.com:article/375Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:40.971379Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
Analysis and Automatic Summary of Privacy Policies
ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
title ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
spellingShingle ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
Alfaro, Rodrigo
Automatic summarization
private policies
risk factors
legal texts
Gensim
Social Networks
Resumen automático
políticas de privacidad
factores de riesgo
textos jurídicos
Gensim
Redes Sociales.
title_short ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
title_full ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
title_fullStr ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
title_full_unstemmed ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
title_sort ARAPP: Análisis y Resumen Automático de Políticas de Privacidad
author Alfaro, Rodrigo
author_facet Alfaro, Rodrigo
Venegas, René
Bronfman, Alan
Valenzuela, Miguel
Riff, Stephanie
Sologuren, Enrique
author_role author
author2 Venegas, René
Bronfman, Alan
Valenzuela, Miguel
Riff, Stephanie
Sologuren, Enrique
author2_role author
author
author
author
author
dc.contributor.author.fl_str_mv Alfaro, Rodrigo
Venegas, René
Bronfman, Alan
Valenzuela, Miguel
Riff, Stephanie
Sologuren, Enrique
dc.subject.por.fl_str_mv Automatic summarization
private policies
risk factors
legal texts
Gensim
Social Networks
Resumen automático
políticas de privacidad
factores de riesgo
textos jurídicos
Gensim
Redes Sociales.
topic Automatic summarization
private policies
risk factors
legal texts
Gensim
Social Networks
Resumen automático
políticas de privacidad
factores de riesgo
textos jurídicos
Gensim
Redes Sociales.
description Un derecho fundamental de los usuarios de aplicaciones informáticas es que puedan conocer las políticas de privacidad (PP) que tales aplicaciones establecen, en particular es relevante que conozcan acerca del tratamiento que aceptan sobre el uso de sus datos. No obstante, estas PP son muy extensas y escritas en un lenguaje administrativo-jurídico y comercial, lo que dificulta su lectura y comprensión. El objetivo de este artículo es resumir automatizadamente las PP de cinco aplicaciones de redes sociales (Facebook, Twitter, TikTok, Snapchat e Instagram) en español, a través de técnicas extractivas y abstractivas. Para ello se utilizan tres aproximaciones de representación desde el Procesamiento de Lenguaje Natural, estas son: Teoría de Grafos, TF-IDF y Gensim. A partir de ellas, se generan automáticamente 15 resúmenes, los que son evaluados por un experto en derecho, para medir la legibilidad y relevancia en base a 20 preguntas confeccionadas por un estudio de la Universidad de Austin, Texas. Por último, a partir de una clasificación de cada política de privacidad, según distintos factores de riesgos, se comprueba que el método Gensim es el más adecuado para la representación y resumen. Además se identifica a Snapchat como la aplicación que mejor cumple dichosfactores.
publishDate 2023
dc.date.none.fl_str_mv 2023-01-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.21814/lm.14.2.375
https://doi.org/10.21814/lm.14.2.375
url https://doi.org/10.21814/lm.14.2.375
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/375
https://linguamatica.com/index.php/linguamatica/article/view/375/486
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 14 No. 2; 23--35
Linguamática; Vol. 14 Núm. 2; 23--35
Linguamática; v. 14 n. 2; 23--35
1647-0818
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133554095947776