this post was submitted on 03 May 2026
25 points (100.0% liked)
Technik
1060 readers
75 users here now
die Community für alles, was man als Technik beschreiben kann
the community for everything you could describe as technology
Beiträge auf Deutsch oder Englisch
Posts in German or English
founded 2 years ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
Ich hab diese These jetzt zum 2. Mal gelesen und muss mal Fragen, woher die kommt.
Nach meiner Interpretation wär's ja das Gegenteil:
LLMs werden durch öffentlichen Code trainiert. Das inkludiert auch GPL Projekte. Die GPL verlangt, dass du den Code nur weiterverwenden kannst, wenn dein Projekt die gleiche Lizenz hat. GPL-2-only und GPL-3-only sind nicht kompatibel. Code von KI ist nicht verwendbar.
Klingt nach einer rationalen Interpretation. Leider findet sie in einer irrationalen Welt statt.
Naja, hier müsste man immer im Einzelfall prüfen, ob das generierte Ergebnis ähnlich zum Original ist. Du hättest Recht, wenn der generierte Code solchen, der unter GPL veröffentlicht worden ist, sehr ähnlich sieht. Ansonsten greift deine Argumentation gar nicht.
Grob gesagt, sämtliche Software, die auf GPL basiert, muss mit GPL lizensiert werden. Möglicherweise hab ich hier jetzt noch (GPL-3) Absatz 5c nicht ganz richtig interpretiert. Daraus resultierend war mein Schluss, dass dies auf die Trainingsdaten anzuwenden ist.
Sofern die Möchlichkeit bestünde, es auf Trainingsdanen anzuwenden, stimme ich der Beschreibung "gar nicht", die du verwendet hast, nicht zu.
Hier frag ich mich, wie du diese Prüfung bewerkstelligen willst.
(Ich glaub, das folgende Stück hier trägt eigentlich kaum was zu meiner Argumentation bei, weil es wenig über die Wahrscheinlichkeit aussagt.)
Ich möchte gern einen Absatz hieraus ansprechen:
Ich will nicht behaupten, dass es häufig vorkäme, sondern ein Beispiel geben, was möglich ist.
Das Problem ist die Kausalkette. Du musst in der Praxis beweisen, dass eine KI genau den fraglichen geschützten Code verwendet hat um den Output zu genieren. Manchmal ist das möglich, wie bei deinem Beispiel, wo die Times solche Kopien im KI-Output entdeckt hat. In diesem Fall haben wir eine Urheberrechtsverletzung, weil der Output defacto dem geschützten Original enstpricht und die KI Firma damit eine Veröffentlichung einer Kopie ohne Erlaubnis vom Urheber tätigt. Im Normalfall wird man hier nicht ohne Weiteres einen Verstoß beweisen können.
Abgesehen davon, haben wir das Problem nur bei Kopien oder Bearbeitungen mit unwesentlichen Änderungen vom Original. Anders sieht es aus, wenn der Code als Inspiration dient. Wenn man als Mensch ein schönes Stück GPL-Code findet, sich davon inspiriert und eigenen Code schreibt, der zwar gewisse Ähnlichkeiten hat, aber insgesamt sehr verschieden zum Original ist, dann unterliegt dieser neue Code nicht automatisch der GPL, stattdessen wird der Programmierer nun selbst zum Urheber des neuen Codes. Das gilt dann analog auch für KI Output, mit dem Unterschied dass der KI-Output selbst nicht urheberrechtlich geschützt ist, weil das Gesetz da nicht anwendbar ist.
Jedenfalls leitet sich daraus ab, dass man prüfen sollte, ob KI-genierter Code bereits existierenden Code irgendwo auf der Welt zu sehr gleicht. Du fragst wie? Naja, hier kollidiert die Theorie mit der Realität: das ist niemals machbar. Und deswegen muss das Urheberrecht eigentlich an die neue Realität angepasst werden. Warum nicht eine KI-Abgabe einführen und an schöpferrisch-tätige Menschen auszahlen? Das System gibt's schon in Deutschland in Form der Urheberrechtsabgabe, die wir alle zwangsweise zahlen, wenn wir Speicher oder Vervielfältigungsgeräte kaufen. Diese wurde damals eingeführt um einen Ausgleich zu schaffen, weil man Menschen erlaubt hat Privatkopien anzufertigen.
Das sind ja zwei verschiedene Themen. Einerseits ist es einfach so, dass nur Menschen ein Urheberrecht erlangen können und ein Affe, der ein Selfie macht, daher kein Recht darauf hat. Das gilt völlig logischerweise auch für Maschinen. Wenn die Maschinen dann allerdings so programmiert sind, dass sie massiv gegen die GPL verstoßen, dann ist das nochmal ein anderes Thema.