Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.25746/ruiips.v11.i3.32523 |
Resumo: | Embora a Inteligência Artificial para a geração de conteúdos, ou Generative AI (GAI), tenha décadas de maturidade, é na década de 2020 que atinge uma massa crítica tal, que não é fácil identificar sectores de atividade em que não tenha aplicações e implicações. Este artigo apresenta duas primeiras perspetivas, aparentemente contrárias às opiniões mais populares - conforme aferido por análise de sentimento em rede social -, sobre dois problemas que ganharam visibilidade com a massificação de sistemas de GAI e de Machine Learning (ML): O problema da atribuição de copyright para trabalhos por estes sistemas; Aplicações para controlo de plágio, por ML. O sentimento presente parece ser que: Trabalhos por sistemas de GAI não podem ser protegidos por copyright, porque tal atribuição só está disponível para autores humanos, facto corroborado em casos como o do fotógrafo David Slater e o auto-retrato de uma símio com o seu equipamento, que levou o United States Copyright Office a recordar que “trabalhos por … entidades não-humanas não são elegíveis para protecção”. A deteção de plágio atingiu níveis de disponibilidade e aceitação tais, que ferramentas baseadas em AI, para Learning Management Systems (LMSs), são agora confiadas por muitos educadores. A nossa perspetiva está desalinhada destas opiniões dominantes, podendo ser resumida assim: Na realidade, há proteção de copyright para qualquer trabalho humano com um mínimo de criatividade atribuível, pelo que ferramentas de GAI que assistam o processo são legítimas, pois o simples esforço de identifica-las, selecioná-las e aplica-las em partes da criação deverá satisfazer os requisitos, com precedentes em casos como a protecção concedida a diretórios de conteúdos, como listas telefónicas: no caso “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc.”, escreve-se explicitamente que “... seleção e arranjo … constituem esforço criativo mínimo”. Quanto à deteção de “plágio” por ferramentas de AI, na realidade a expressão comummente refere-se à deteção de similaridades, e não ao radical do termo, que é o não reconhecimento de trabalho alheio. Assim, quanto à mensuração de quanto é que um trabalho é copiado; em particular, se trabalhos de texto são produzidos por sistemas de GAI, no limite essa deteção é impossível e tais soluções são não confiáveis. É quase paradoxal que sejam técnicas de GANs (Generative Adversarial Networks) a, simultaneamente, justificar a confiança em soluções para este propósito, e também a justificarem a perspetiva de que não há solução, a prazo. Uma GAN é, na sua essência, a oposição entre um sistema gerador e um sistema avaliador ou discriminador. O avaliador tem “vasto” conhecimento de determinados trabalhos, como textos ou fotografias verdadeiras; o gerador começa por produzir lixo aleatório, que o discriminador detetará facilmente como uma falsidade. Ao longo da oposição, ambas as partes vão melhorando, a gerar e a detetar falsidades, mas a partir de certa iteração, o expectável é que o gerador produza conteúdos indistinguíveis da realidade. Assim, a mesma abordagem que constitui solução para a deteção, é solução para derrotar-se a si própria. |
id |
RCAP_71b1efdf387f7841ef86b403316fe919 |
---|---|
oai_identifier_str |
oai:ojs.revistas.rcaap.pt:article/32523 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial IntelligencePerspetivas sobre Copyright e plágio, no contexto de Generative Artificial IntelligenceResumoEmbora a Inteligência Artificial para a geração de conteúdos, ou Generative AI (GAI), tenha décadas de maturidade, é na década de 2020 que atinge uma massa crítica tal, que não é fácil identificar sectores de atividade em que não tenha aplicações e implicações. Este artigo apresenta duas primeiras perspetivas, aparentemente contrárias às opiniões mais populares - conforme aferido por análise de sentimento em rede social -, sobre dois problemas que ganharam visibilidade com a massificação de sistemas de GAI e de Machine Learning (ML): O problema da atribuição de copyright para trabalhos por estes sistemas; Aplicações para controlo de plágio, por ML. O sentimento presente parece ser que: Trabalhos por sistemas de GAI não podem ser protegidos por copyright, porque tal atribuição só está disponível para autores humanos, facto corroborado em casos como o do fotógrafo David Slater e o auto-retrato de uma símio com o seu equipamento, que levou o United States Copyright Office a recordar que “trabalhos por … entidades não-humanas não são elegíveis para protecção”. A deteção de plágio atingiu níveis de disponibilidade e aceitação tais, que ferramentas baseadas em AI, para Learning Management Systems (LMSs), são agora confiadas por muitos educadores. A nossa perspetiva está desalinhada destas opiniões dominantes, podendo ser resumida assim: Na realidade, há proteção de copyright para qualquer trabalho humano com um mínimo de criatividade atribuível, pelo que ferramentas de GAI que assistam o processo são legítimas, pois o simples esforço de identifica-las, selecioná-las e aplica-las em partes da criação deverá satisfazer os requisitos, com precedentes em casos como a protecção concedida a diretórios de conteúdos, como listas telefónicas: no caso “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc.”, escreve-se explicitamente que “... seleção e arranjo … constituem esforço criativo mínimo”. Quanto à deteção de “plágio” por ferramentas de AI, na realidade a expressão comummente refere-se à deteção de similaridades, e não ao radical do termo, que é o não reconhecimento de trabalho alheio. Assim, quanto à mensuração de quanto é que um trabalho é copiado; em particular, se trabalhos de texto são produzidos por sistemas de GAI, no limite essa deteção é impossível e tais soluções são não confiáveis. É quase paradoxal que sejam técnicas de GANs (Generative Adversarial Networks) a, simultaneamente, justificar a confiança em soluções para este propósito, e também a justificarem a perspetiva de que não há solução, a prazo. Uma GAN é, na sua essência, a oposição entre um sistema gerador e um sistema avaliador ou discriminador. O avaliador tem “vasto” conhecimento de determinados trabalhos, como textos ou fotografias verdadeiras; o gerador começa por produzir lixo aleatório, que o discriminador detetará facilmente como uma falsidade. Ao longo da oposição, ambas as partes vão melhorando, a gerar e a detetar falsidades, mas a partir de certa iteração, o expectável é que o gerador produza conteúdos indistinguíveis da realidade. Assim, a mesma abordagem que constitui solução para a deteção, é solução para derrotar-se a si própria. Although Artificial Intelligence for Content Generation, or Generative AI (GAI), is decades old, it is in the 2020s that it reaches such critical mass, that it is not easy to identify activity sectors immune to its applications and implications. This article presents two perspectives, somewhat contrarian to popular opinion - as measured by social network sentiment analysis - on two problems that gained visibility with the massification of GAI and Machine Learning (ML) systems: The problem of copyright attribution to works based on these systems; ML-based applications for plagiarism control. The current perception seems to be that: GAI-based creations cannot be protected by Copyright, because such protection is only available to humans, as seen in cases such as the photographer David Slater and the self-portrait of a macaque using his equipment, in which the United States Copyright Office recalled that "works by ... non-human entities are not eligible for copyright protection". Plagiarism detection has reached such levels of availability and acceptance, namely in the form of AI-based tools for Learning Management Systems (LMSs), that they are now trusted by many educators. Our perspective is misaligned from these opinions, and can be summed up as follows: In fact, there is Copyright protection for any human-attributable work with a minimum of creative effort, so GAI-based tools that assist the process, are legitimate. The mere effort to identify, select and apply them should meet the requirements, with precedent in cases such as “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc. ”, in which protection was granted to content directories, such as phone numbers, where it was considered that the “... selection and arrangement … constitute minimal creative effort ”. Regarding the detection of “plagiarism” by AI tools, in fact the expression commonly refers to the detection of similarities, not to the radical meaning of the term, which is the non-recognition of the work of others. Regarding assessing how much of a work is copied, in particular if some text is the output of an AI system, in the limit this detection is impossible and the available solutions are not reliable. Almost paradoxically, it is the same GANS (Generative Adversarial Networks) that eventually support the confidence in solutions for this purpose, that also justify the perspective that there is no solution, on the long run. A GAN, is the opposition between a generator and an evaluator or discriminator system. The evaluator has “vast” knowledge of certain works, such as texts or real photographs; the generator begins by creating random outputs, which the discriminator will easily detect as a fake. As the process runs, both parts get better, but from a certain iteration, the generator is expected to produce content indistinguishable of reality. Thus, the very same approach that offers a solution to detection, is a solution to its defeat.Research Unit of Polytechnic Institute of Santarém2023-12-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttps://doi.org/10.25746/ruiips.v11.i3.32523por2182-9608Marques, ArturMadeira, Filipeinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-04T19:16:01Zoai:ojs.revistas.rcaap.pt:article/32523Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:30:05.459355Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
title |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
spellingShingle |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence Marques, Artur Resumo |
title_short |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
title_full |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
title_fullStr |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
title_full_unstemmed |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
title_sort |
Perspetivas sobre Copyright e plágio, no contexto de Generative Artificial Intelligence |
author |
Marques, Artur |
author_facet |
Marques, Artur Madeira, Filipe |
author_role |
author |
author2 |
Madeira, Filipe |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Marques, Artur Madeira, Filipe |
dc.subject.por.fl_str_mv |
Resumo |
topic |
Resumo |
description |
Embora a Inteligência Artificial para a geração de conteúdos, ou Generative AI (GAI), tenha décadas de maturidade, é na década de 2020 que atinge uma massa crítica tal, que não é fácil identificar sectores de atividade em que não tenha aplicações e implicações. Este artigo apresenta duas primeiras perspetivas, aparentemente contrárias às opiniões mais populares - conforme aferido por análise de sentimento em rede social -, sobre dois problemas que ganharam visibilidade com a massificação de sistemas de GAI e de Machine Learning (ML): O problema da atribuição de copyright para trabalhos por estes sistemas; Aplicações para controlo de plágio, por ML. O sentimento presente parece ser que: Trabalhos por sistemas de GAI não podem ser protegidos por copyright, porque tal atribuição só está disponível para autores humanos, facto corroborado em casos como o do fotógrafo David Slater e o auto-retrato de uma símio com o seu equipamento, que levou o United States Copyright Office a recordar que “trabalhos por … entidades não-humanas não são elegíveis para protecção”. A deteção de plágio atingiu níveis de disponibilidade e aceitação tais, que ferramentas baseadas em AI, para Learning Management Systems (LMSs), são agora confiadas por muitos educadores. A nossa perspetiva está desalinhada destas opiniões dominantes, podendo ser resumida assim: Na realidade, há proteção de copyright para qualquer trabalho humano com um mínimo de criatividade atribuível, pelo que ferramentas de GAI que assistam o processo são legítimas, pois o simples esforço de identifica-las, selecioná-las e aplica-las em partes da criação deverá satisfazer os requisitos, com precedentes em casos como a protecção concedida a diretórios de conteúdos, como listas telefónicas: no caso “Feist Publications, Inc. vs. Rural Telephone Service Co., Inc.”, escreve-se explicitamente que “... seleção e arranjo … constituem esforço criativo mínimo”. Quanto à deteção de “plágio” por ferramentas de AI, na realidade a expressão comummente refere-se à deteção de similaridades, e não ao radical do termo, que é o não reconhecimento de trabalho alheio. Assim, quanto à mensuração de quanto é que um trabalho é copiado; em particular, se trabalhos de texto são produzidos por sistemas de GAI, no limite essa deteção é impossível e tais soluções são não confiáveis. É quase paradoxal que sejam técnicas de GANs (Generative Adversarial Networks) a, simultaneamente, justificar a confiança em soluções para este propósito, e também a justificarem a perspetiva de que não há solução, a prazo. Uma GAN é, na sua essência, a oposição entre um sistema gerador e um sistema avaliador ou discriminador. O avaliador tem “vasto” conhecimento de determinados trabalhos, como textos ou fotografias verdadeiras; o gerador começa por produzir lixo aleatório, que o discriminador detetará facilmente como uma falsidade. Ao longo da oposição, ambas as partes vão melhorando, a gerar e a detetar falsidades, mas a partir de certa iteração, o expectável é que o gerador produza conteúdos indistinguíveis da realidade. Assim, a mesma abordagem que constitui solução para a deteção, é solução para derrotar-se a si própria. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-12-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.25746/ruiips.v11.i3.32523 |
url |
https://doi.org/10.25746/ruiips.v11.i3.32523 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
2182-9608 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Research Unit of Polytechnic Institute of Santarém |
publisher.none.fl_str_mv |
Research Unit of Polytechnic Institute of Santarém |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799136783326248960 |