Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence

Detalhes bibliográficos
Autor(a) principal: Marques, Artur
Data de Publicação: 2023
Outros Autores: Madeira, Filipe
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.25746/ruiips.v11.i3.32523
Resumo: Embora a Inteligência Artificial para a geração de conteúdos, ou Generative AI (GAI), tenha décadas de maturidade, é na década de 2020 que atinge uma massa crítica tal, que não é fácil identificar sectores de atividade em que não tenha aplicações e implicações. Este artigo apresenta duas primeiras perspetivas, aparentemente contrárias às opiniões mais populares - conforme aferido por análise de sentimento em rede social -, sobre dois problemas que ganharam visibilidade com a massificação de sistemas de GAI e de Machine Learning (ML): O problema da atribuição de copyright para trabalhos por estes sistemas; Aplicações para controlo de plágio, por ML. O sentimento presente parece ser que: Trabalhos por sistemas de GAI não podem ser protegidos por copyright, porque tal atribuição só está disponível para autores humanos, facto corroborado em casos como o do fotógrafo David Slater e o auto-retrato de uma símio com o seu equipamento, que levou o United States Copyright Office a recordar que “trabalhos por … entidades não-humanas não são elegíveis para protecção”. A deteção de plágio atingiu níveis de disponibilidade e aceitação tais, que ferramentas baseadas em AI, para Learning Management Systems (LMSs), são agora confiadas por muitos educadores. A nossa perspetiva está desalinhada destas opiniões dominantes, podendo ser resumida assim: Na realidade, há proteção de copyright para qualquer trabalho humano com um mínimo de criatividade atribuível, pelo que ferramentas de GAI que assistam o processo são legítimas, pois o simples esforço de identifica-las, selecioná-las e aplica-las em partes da criação deverá satisfazer os requisitos, com precedentes em casos como a protecção concedida a diretórios de conteúdos, como listas telefónicas: no caso “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc.”, escreve-se explicitamente que “... seleção e arranjo … constituem esforço criativo mínimo”. Quanto à deteção de “plágio” por ferramentas de AI, na realidade a expressão comummente refere-se à deteção de similaridades, e não ao radical do termo, que é o não reconhecimento de trabalho alheio. Assim, quanto à mensuração de quanto é que um trabalho é copiado; em particular, se trabalhos de texto são produzidos por sistemas de GAI, no limite essa deteção é impossível e tais soluções são não confiáveis. É quase paradoxal que sejam técnicas de GANs (Generative Adversarial Networks) a, simultaneamente, justificar a confiança em soluções para este propósito, e também a justificarem a perspetiva de que não há solução, a prazo. Uma GAN é, na sua essência, a oposição entre um sistema gerador e um sistema avaliador ou discriminador. O avaliador tem “vasto” conhecimento de determinados trabalhos, como textos ou fotografias verdadeiras; o gerador começa por produzir lixo aleatório, que o discriminador detetará facilmente como uma falsidade. Ao longo da oposição, ambas as partes vão melhorando, a gerar e a detetar falsidades, mas a partir de certa iteração, o expectável é que o gerador produza conteúdos indistinguíveis da realidade. Assim, a mesma abordagem que constitui solução para a deteção, é solução para derrotar-se a si própria.  
id RCAP_71b1efdf387f7841ef86b403316fe919
oai_identifier_str oai:ojs.revistas.rcaap.pt:article/32523
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial IntelligencePerspetivas sobre Copyright e plágio, no contexto de Generative Artificial IntelligenceResumoEmbora a Inteligência Artificial para a geração de conteúdos, ou Generative AI (GAI), tenha décadas de maturidade, é na década de 2020 que atinge uma massa crítica tal, que não é fácil identificar sectores de atividade em que não tenha aplicações e implicações. Este artigo apresenta duas primeiras perspetivas, aparentemente contrárias às opiniões mais populares - conforme aferido por análise de sentimento em rede social -, sobre dois problemas que ganharam visibilidade com a massificação de sistemas de GAI e de Machine Learning (ML): O problema da atribuição de copyright para trabalhos por estes sistemas; Aplicações para controlo de plágio, por ML. O sentimento presente parece ser que: Trabalhos por sistemas de GAI não podem ser protegidos por copyright, porque tal atribuição só está disponível para autores humanos, facto corroborado em casos como o do fotógrafo David Slater e o auto-retrato de uma símio com o seu equipamento, que levou o United States Copyright Office a recordar que “trabalhos por … entidades não-humanas não são elegíveis para protecção”. A deteção de plágio atingiu níveis de disponibilidade e aceitação tais, que ferramentas baseadas em AI, para Learning Management Systems (LMSs), são agora confiadas por muitos educadores. A nossa perspetiva está desalinhada destas opiniões dominantes, podendo ser resumida assim: Na realidade, há proteção de copyright para qualquer trabalho humano com um mínimo de criatividade atribuível, pelo que ferramentas de GAI que assistam o processo são legítimas, pois o simples esforço de identifica-las, selecioná-las e aplica-las em partes da criação deverá satisfazer os requisitos, com precedentes em casos como a protecção concedida a diretórios de conteúdos, como listas telefónicas: no caso “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc.”, escreve-se explicitamente que “... seleção e arranjo … constituem esforço criativo mínimo”. Quanto à deteção de “plágio” por ferramentas de AI, na realidade a expressão comummente refere-se à deteção de similaridades, e não ao radical do termo, que é o não reconhecimento de trabalho alheio. Assim, quanto à mensuração de quanto é que um trabalho é copiado; em particular, se trabalhos de texto são produzidos por sistemas de GAI, no limite essa deteção é impossível e tais soluções são não confiáveis. É quase paradoxal que sejam técnicas de GANs (Generative Adversarial Networks) a, simultaneamente, justificar a confiança em soluções para este propósito, e também a justificarem a perspetiva de que não há solução, a prazo. Uma GAN é, na sua essência, a oposição entre um sistema gerador e um sistema avaliador ou discriminador. O avaliador tem “vasto” conhecimento de determinados trabalhos, como textos ou fotografias verdadeiras; o gerador começa por produzir lixo aleatório, que o discriminador detetará facilmente como uma falsidade. Ao longo da oposição, ambas as partes vão melhorando, a gerar e a detetar falsidades, mas a partir de certa iteração, o expectável é que o gerador produza conteúdos indistinguíveis da realidade. Assim, a mesma abordagem que constitui solução para a deteção, é solução para derrotar-se a si própria.  Although Artificial Intelligence for Content Generation, or Generative AI (GAI), is decades old, it is in the 2020s that it reaches such critical mass, that it is not easy to identify activity sectors immune to its applications and implications.   This article presents two perspectives, somewhat contrarian to popular opinion - as measured by social network sentiment analysis - on two problems that gained visibility with the massification of GAI and Machine Learning (ML) systems: The problem of copyright attribution to works based on these systems; ML-based applications for plagiarism control.   The current perception seems to be that: GAI-based creations cannot be protected by Copyright, because such protection is only available to humans, as seen in cases such as the photographer David Slater and the self-portrait of a macaque using his equipment, in which the United States Copyright Office recalled that "works by ... non-human entities are not eligible for copyright protection". Plagiarism detection has reached such levels of availability and acceptance, namely in the form of AI-based tools for Learning Management Systems (LMSs), that they are now trusted by many educators.   Our perspective is misaligned from these opinions, and can be summed up as follows:   In fact, there is Copyright protection for any human-attributable work with a minimum of creative effort, so GAI-based tools that assist the process, are legitimate. The mere effort to identify, select and apply them should meet the requirements, with precedent in cases such as “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc. ”, in which protection was granted to content directories, such as phone numbers, where it was considered that the “... selection and arrangement … constitute minimal creative effort ”. Regarding the detection of “plagiarism” by AI tools, in fact the expression commonly refers to the detection of similarities, not to the radical meaning of the term, which is the non-recognition of the work of others. Regarding assessing how much of a work is copied, in particular if some text is the output of an AI system, in the limit this detection is impossible and the available solutions are not reliable. Almost paradoxically, it is the same GANS (Generative Adversarial Networks) that eventually support the confidence in solutions for this purpose, that also justify the perspective that there is no solution, on the long run. A GAN, is the opposition between a generator and an evaluator or discriminator system. The evaluator has “vast” knowledge of certain works, such as texts or real photographs; the generator begins by creating random outputs, which the discriminator will easily detect as a fake. As the process runs, both parts get better, but from a certain iteration, the generator is expected to produce content indistinguishable of reality. Thus, the very same approach that offers a solution to detection, is a solution to its defeat.Research Unit of Polytechnic Institute of Santarém2023-12-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttps://doi.org/10.25746/ruiips.v11.i3.32523por2182-9608Marques, ArturMadeira, Filipeinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-04T19:16:01Zoai:ojs.revistas.rcaap.pt:article/32523Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:30:05.459355Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
title Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
spellingShingle Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
Marques, Artur
Resumo
title_short Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
title_full Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
title_fullStr Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
title_full_unstemmed Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
title_sort Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
author Marques, Artur
author_facet Marques, Artur
Madeira, Filipe
author_role author
author2 Madeira, Filipe
author2_role author
dc.contributor.author.fl_str_mv Marques, Artur
Madeira, Filipe
dc.subject.por.fl_str_mv Resumo
topic Resumo
description Embora a Inteligência Artificial para a geração de conteúdos, ou Generative AI (GAI), tenha décadas de maturidade, é na década de 2020 que atinge uma massa crítica tal, que não é fácil identificar sectores de atividade em que não tenha aplicações e implicações. Este artigo apresenta duas primeiras perspetivas, aparentemente contrárias às opiniões mais populares - conforme aferido por análise de sentimento em rede social -, sobre dois problemas que ganharam visibilidade com a massificação de sistemas de GAI e de Machine Learning (ML): O problema da atribuição de copyright para trabalhos por estes sistemas; Aplicações para controlo de plágio, por ML. O sentimento presente parece ser que: Trabalhos por sistemas de GAI não podem ser protegidos por copyright, porque tal atribuição só está disponível para autores humanos, facto corroborado em casos como o do fotógrafo David Slater e o auto-retrato de uma símio com o seu equipamento, que levou o United States Copyright Office a recordar que “trabalhos por … entidades não-humanas não são elegíveis para protecção”. A deteção de plágio atingiu níveis de disponibilidade e aceitação tais, que ferramentas baseadas em AI, para Learning Management Systems (LMSs), são agora confiadas por muitos educadores. A nossa perspetiva está desalinhada destas opiniões dominantes, podendo ser resumida assim: Na realidade, há proteção de copyright para qualquer trabalho humano com um mínimo de criatividade atribuível, pelo que ferramentas de GAI que assistam o processo são legítimas, pois o simples esforço de identifica-las, selecioná-las e aplica-las em partes da criação deverá satisfazer os requisitos, com precedentes em casos como a protecção concedida a diretórios de conteúdos, como listas telefónicas: no caso “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc.”, escreve-se explicitamente que “... seleção e arranjo … constituem esforço criativo mínimo”. Quanto à deteção de “plágio” por ferramentas de AI, na realidade a expressão comummente refere-se à deteção de similaridades, e não ao radical do termo, que é o não reconhecimento de trabalho alheio. Assim, quanto à mensuração de quanto é que um trabalho é copiado; em particular, se trabalhos de texto são produzidos por sistemas de GAI, no limite essa deteção é impossível e tais soluções são não confiáveis. É quase paradoxal que sejam técnicas de GANs (Generative Adversarial Networks) a, simultaneamente, justificar a confiança em soluções para este propósito, e também a justificarem a perspetiva de que não há solução, a prazo. Uma GAN é, na sua essência, a oposição entre um sistema gerador e um sistema avaliador ou discriminador. O avaliador tem “vasto” conhecimento de determinados trabalhos, como textos ou fotografias verdadeiras; o gerador começa por produzir lixo aleatório, que o discriminador detetará facilmente como uma falsidade. Ao longo da oposição, ambas as partes vão melhorando, a gerar e a detetar falsidades, mas a partir de certa iteração, o expectável é que o gerador produza conteúdos indistinguíveis da realidade. Assim, a mesma abordagem que constitui solução para a deteção, é solução para derrotar-se a si própria.  
publishDate 2023
dc.date.none.fl_str_mv 2023-12-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.25746/ruiips.v11.i3.32523
url https://doi.org/10.25746/ruiips.v11.i3.32523
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 2182-9608
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Research Unit of Polytechnic Institute of Santarém
publisher.none.fl_str_mv Research Unit of Polytechnic Institute of Santarém
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136783326248960