A OpenAI obteve uma vitória inicial na quinta-feira em um dos muitos processos que a empresa enfrenta pelo uso não licenciado de material protegido por direitos autorais para treinar produtos generativos de IA como o ChatGPT.
Um juiz federal do distrito sul de Nova York indeferiu um reclamação trazida pelos meios de comunicação Raw Story e AlterNet, que alegaram que a OpenAI violou a lei de direitos autorais ao remover propositalmente o que é conhecido como informações de gerenciamento de direitos autorais, como títulos de artigos e nomes de autores, de material que incorporou em seus conjuntos de dados de treinamento.
A OpenAI apresentou uma moção para encerrar o caso, argumentando que os demandantes não tinham legitimidade para processar porque não haviam demonstrado um dano concreto aos seus negócios causado pela remoção das informações de gestão de direitos autorais. Juíza Colleen McMahon acordadorejeitando a ação, mas deixando a porta aberta para os demandantes apresentarem uma reclamação alterada.
A OpenAI e outras empresas de IA generativa estão lutando contra dezenas de ações judiciais de direitos autorais movidas por agências de notícias, editoras de livros, artistas e gravadoras.
O caso Raw Story e AlterNet diferiu de muitos dos outros processos porque se centrava numa disposição restrita da Lei de Direitos Autorais do Milénio Digital (DMCA) que proíbe a remoção de informações de gestão de direitos de autor de uma obra, a fim de permitir ou ocultar a violação de direitos de autor.
Os meios de comunicação argumentaram que a remoção das informações por si só constituía um dano concreto e criava um risco substancial de que os grandes modelos de linguagem da OpenAI regurgitassem literalmente seus trabalhos protegidos por direitos autorais.
McMahon não achou esse argumento convincente, escrevendo que os demandantes não “alegaram qualquer real efeitos adversos decorrentes desta suposta violação do DMCA.”
“Quando um usuário insere uma pergunta no ChatGPT, o ChatGPT sintetiza as informações relevantes em seu repositório em uma resposta”, escreveu ela. “Dada a quantidade de informações contidas no repositório, a probabilidade de o ChatGPT produzir conteúdo plagiado de um dos artigos dos Requerentes parece remota.”
Em outros casos, especialmente um ação judicial movido pelo New York Times contra a OpenAI e a Microsoft, os demandantes alegaram que os produtos das empresas reproduziam de fato grandes seções de trabalhos protegidos por direitos autorais.
A reclamação do Times inclui vários exemplos de ChatGPT e Bing Chat da Microsoft respondendo às solicitações dos usuários com vários parágrafos de conteúdo copiados literalmente dos artigos do jornal.
A decisão de McMahon não aborda diretamente as alegações do Times, mas sua decisão sugere que os demandantes que esperam ganhar um caso de direitos autorais de IA em seu tribunal terão que demonstrar não apenas que um modelo generativo reproduziu algum trabalho no passado ou pode fazê-lo em o futuro, mas que sua versão atual está reproduzindo ativamente a obra.
“Embora os Requerentes forneçam estatísticas de terceiros indicando que um mais cedo versão do ChatGPT gerou respostas contendo quantidades significativas de conteúdo plagiado, os Requerentes não alegaram de forma plausível que haja um ‘risco substancial’ de que o atual versão do ChatGPT irá gerar uma resposta plagiando um dos Requerentes artigos”, escreveu ela.