Violação de direitos autorais: dois autores processam a Apple

No mesmo dia em que a Anthropic chegou a um acordo extrajudicial, a Apple foi processada por dois autores por violação de direitos autorais . A empresa de Cupertino é acusada de treinar seus modelos de IA com cópias piratas de livros incluídos no conjunto de dados RedPajama.
OpenELM: Treinamento PirataA denúncia ( PDF ) apresentada pelos advogados de Grady Hendrix e Jennifer Roberson afirma que a Apple utilizou o conjunto de dados RedPajama para treinar os modelos OpenELM de código aberto, disponíveis há mais de um ano no Hugging Face. Essa confirmação vem diretamente do documento publicado pela própria empresa de Cupertino.
Um dos conjuntos de dados incluídos no RedPajama é o Books , que por sua vez é uma cópia do Book3 (parte da compilação The Pile da EleutherAI). O Book3 contém cópias piratas de livros da Bibliotik , uma das mais notórias "bibliotecas paralelas" online. O Book3 contém aproximadamente 196.640 livros, incluindo aqueles publicados pelos dois autores. A Apple essencialmente admitiu usar cópias piratas para treinar modelos OpenELM.
Em um caso semelhante , referente ao uso de legendas em vídeos postados no YouTube, a Apple afirmou que o OpenELM não é usado para nenhuma funcionalidade de IA e, portanto, não gera receita. De acordo com os advogados dos autores, a empresa de Cupertino também utilizou o conjunto de dados Booke para treinar modelos usados para o Apple Intelligence , a partir dos quais gera receita.
A denúncia alega que a Apple violou direitos autorais ao não obter a permissão dos autores e pagar indenização. Os advogados, portanto, pedem ao juiz que aprove a ação coletiva, ordene a destruição dos conjuntos de dados e modelos, emita uma liminar permanente para impedir a conduta infratora, indenize e reembolse os honorários advocatícios.
Punto Informatico