Ausgangspunkt war die Stanford-Studie „Extracting Books from Production Language Models“, die empirisch untersucht, ob große Sprachmodelle trotz implementierter Schutzmechanismen in der Lage sind, urheberrechtlich geschützte Werke in langen, nahezu wortgleichen Textpassagen wiederzugeben. Im Zentrum stand dabei die Frage, ob sich aus produktiv eingesetzten Modellen tatsächlich reproduzierbare Outputs erzeugen lassen, die inhaltlich mit geschützten Werken übereinstimmen. Untersucht wurden die Modelle Claude
