Seit über einem Monat befindet sich der Text-zu-Bildgenerator DALL-E 2 nun in der offenen Beta und erlaubt es, allen registrierten Nutzerinnen und Nutzern in nur wenigen Sekunden Grafiken in einer riesigen Stilvielfalt zu erstellen.
Wir stellen euch das Computerprogramm vor und erklären, wie es funktioniert. Im Fazit wechselt ausnahmsweise die Perspektive von „wir“ zu „ich“ und ich gebe aus Sicht einer Künstlerin und Kunstwissenschaftlerin ganz subjektiv und persönlich eine Einschätzung dazu ab, welche Rolle AI Art für die Zukunft von Kreativschaffenden spielen könnte.
Was ist DALL-E und wie nutzt man es?
DALL-E 2 ist der direkte Nachfolger des Computerprogramms DALL-E, beziehungsweise DALL-E 1, vom Entwicklerteam OpenAI, das Bilder aus Textbeschreibungen generieren kann. Das macht es mithilfe von maschinellem Lernen. Die Software wird dabei anhand von Millionen im Internet verfügbarer Bilder trainiert, wobei menschliches Feedback genutzt wird, um Fehler auszubessern.
Die Künstliche Intelligenz ist passender Weise nach einer Fusion des spanischen Surrealisten Salvador Dali und dem kleinen Müllbeseitigungsroboter WALL-E benannt. Der Name ist also ein sogenanntes Koffer- oder Schachtelwort, das zwei bestehende Wörter zu einem neuen dritten verbindet.
Seit dem 28. September müssen sich Interessenten nicht länger auf eine Warteliste setzen lassen, die zunächst Künstlerinnen und Künstlern vorbehalten war. Wer die KI-Spielerei selbst ausprobieren will, braucht nur eine E-Mail-Adresse und eine Handynummer, um sich kostenlos zu registrieren.
Im Detail sieht das so aus:
- Konto mit E-Mail und Passwort anlegen
- E-Mail-Adresse verifizieren
- Mobilfunknummer angeben
- Zugeschickten Anmeldecode eintragen
Nach der erfolgreichen Anmeldung stehen euch 50 Credits – also 50 Bilder-Sets a 4 Variationen – zur Verfügung. Anschließend werden euch monatlich jeweils 15 kostenlose Credits bereitgestellt. Wem das nicht reicht, der oder die kann weitere kostenpflichtig erwerben. Das Minimum beim Kauf liegt bei 115 Credits für 15 US-Dollar.
Dann kann es auch schon losgehen! Ihr tippt Begriffe in das Eingabefeld und klickt auf den Befehl „Generate“ – Voila! Die AI wandelt euren Text in Anordnungen von Pixeln um. Doch wie genau erzielt man ein gutes Ergebnis?
Der Kniff liegt in einer detaillierten Beschreibung und etwas Geduld. Auf der Startseite werdet ihr unter anderem mit dem Beispiel „An Impressionist oil painting of sunflowers in a purple vase…“ begrüßt und dem Hinweis, dem System möglichst genau zu beschreiben, was dargestellt und welcher Stil imitiert werden soll. Wichtig zu beachten ist, dass DALL-E nur englische Sprache verarbeiten kann.
Im Grunde folgt ihr diesem Muster:
- Hauptmotiv oder Subjekt → Wer oder was soll dargestellt werden?
- Nähere Beschreibung durch Verben und Attribute (etc.) → Was macht das Subjekt? Welche Farbe soll es haben? (etc.)
- Stil → Welche Kunstrichtung soll imitiert werden? (z.B. Pixel Art oder Claude Monet etc.)
Wir empfehlen euch, euch durch die vielen Werke auf der Seite zu klicken und nachzulesen, wie andere ihre Beschreibung formuliert haben. Die vielen generierten Werke von anderen sind eine prima Inspiration und Orientierungshilfe!
Hier seht ihr meine Ergebnisse nach der Deskription „kids playing video games, digital art“ – Na, das kann sich doch sehen lassen, oder? Natürlich lassen sich in allen vier Bildern die für KI-Kunst typischen „glitchartigen“ Artefakte und Fehler entdecken, aber das ließe sich mit etwas Bildbearbeitung leicht korrigieren.
Alle erstellten Bilder lassen sich herunterladen und unter einer öffentlichen Lizenz teilen. Die Sicherheitsfilter von OpenAI sollen sicherstellen, dass Nacktheit, gewaltverherrlichende Bilder oder solche, die für politische Zwecke missbraucht werden könnten, nicht generiert werden.
Neben dem Erstellen von neuen Grafiken, kann DALL-E zusätzlich genutzt werden, um Variationen nach einem Vorbild zu schaffen oder mit dem Tool Outpainting ein bestehendes Bild zu editieren. Einige Beispiele dazu findet ihr weiter unten in diesem Artikel und natürlich auf der offiziellen Homepage.
Künstliche Intelligenz versus Kreativität: DALL-E zwischen Fluch und Segen?
Spätestens seitdem das mithilfe von Midjourney generierte Werk „Théâtre D’opéra Spatial“ einen Kunst-Wettbewerb gewonnen hat, spaltet sich die Gesellschaft in jene, die das Potential von AI Art feiern, und die, die den Untergang der Kunst beschwören. [Den Fall im Speziellen könnt ihr beispielsweise bei den Kolleginnen und Kollegen von GameStar nochmal nachlesen.]
Wenn über mögliche Chancen und Risiken diskutiert werden soll, ist es sinnvoll, einzuschränken, welche Personengruppen überwiegend von KI-Kunst profitieren sollen und welchen dabei geschadet werden könnte. Ironischerweise handelt es sich dabei um ein und dieselbe: Kunstschaffende – seien es nun Concept Artists, Kinderbuchillustratoren oder Comiczeichnerinnen.
Programme wie DALL-E können Künstlerinnen und Künstlern dabei helfen, Zeit zu sparen, indem beispielsweise schnell und einfach Variationen einer Idee generiert werden können. Außerdem können passende Referenzbilder erstellt werden, anhand derer weitergearbeitet werden kann oder die einfach als Inspiration und Gedankenanstoß dienen können. Zeit sparen heißt in vielen Fällen auch Geld sparen, was vor allem Selbständigen und Indie Studios zugute kommen könnte.
Hier seht ihr zum Beispiel Variation meines Original Charakters Saphir. Es ist unglaublich spannend, wie die KI mein Original abgewandelt hat und dennoch wichtige Merkmale beibehält. In der Konzeptions- und Findungsphase stelle ich mir dieses Feature sehr praktisch vor.
Am „Outpainting“ meines Bisasam-Fanart lässt sich schön aufzeigen, wie das Programm versucht, meinen Kolorationsstil zu kopieren, um den Hintergrund – wenn auch sichtlich unperfekt – zu ergänzen.
In beiden Fällen sind die Ergebnisse nicht gut genug, um sie ohne weitere Bearbeitung zu gebrauchten, aber durchaus interessant. Sie inspirieren mich zu neuen eigenen Motiven, auf die ich womöglich so nicht gekommen wäre.
Ganz nach dem Motto „Jeder Mensch ist ein Künstler“ finde ich außerdem den Aspekt der Partizipation besonders wertvoll. Nach dem offenen Kunstbegriff von Joseph Beuys liegt das Schöpferische (und somit das Künstlerische) bereits in unseren Gedanken. KI-Programme können dabei auch Menschen, denen die Mittel oder Fähigkeiten nicht zur Verfügung stehen, dabei helfen, ihre künstlerischen Gedanken zu visualisieren und mit anderen zu teilen.
Leider sind an eben diese Vorteile auch die Schattenseiten geknüpft. So befürchten zum Beispiel viele aus der Art-Community, dass weniger Arbeitskräfte für Kunst und Design eingestellt werden, wenn KI einen großen Teil der Arbeit schneller und für deutlich weniger Geld erledigen könnte, und damit die ohnehin schon finanziell prekäre Situation für viele Kreativschaffende weiter verschlechtert wird.
Besonders ärgerlich ist dabei, dass das System anhand von Menschen geschaffener Kunstwerke trainiert wird, diese Künstler und Künstlerinnen hinter der Anonymisierung des Algorithmus aber völlig verschwinden und ihnen keine Form von Anerkennung gezollt werden kann.
Hier mal ein Beispiel zur Veranschaulichung. Dieses meiner generierten Werke hat mir besonders gut gefallen. Ratet mal, welche Beschreibung ich genutzt habe? „A magician in JoJo pose, digital art“ – Wenn man das weiß, lässt sich leicht eine Verknüpfung zu Charakteren wie Speedwagon knüpfen ohne dass das Ergebnis per se stark nach JoJo’s Bizzare Adventures oder dem Stil von Mangaka Hirohiko Araki aussieht.
Das liegt daran, dass hier undurchsichtig viele Arbeiten einfließen, die dieses neue Werk als Ganzes ausmachen. Ich würde jedoch gerne wissen, welche Talente dahinter stecken, ich möchte ihre Social-Media-Seiten aufrufen können, ihnen folgen und sie unterstützen. Ich würde gerne meine Dankbarkeit ausdrücken können, schließlich tragen sie beim Entwickeln meiner eigenen Ideen und Konzepte bei.
In Japan sorgte der AI-Generator Mimic für Aufsehen. Was dazu gedacht war, den Stil der Mangaka zu kopieren, um ihnen Zeit und dem Studio Kosten zu sparen, entpuppte sich für viele als klare Verletzung von Urheberrechten. Künstlerinnen und Künstler sorgen sich, dass mit solcher Software ihre charakteristische Handschrift gestohlen werden könnte, um Fakes zu produzieren, und rufen zum Boykott auf.
Nicht unerwähnt lassen möchte ich noch die beiden Argumente, dass trotz Sicherheitsfilter die Chancen hoch sind, trotzdem manipulative und verunglimpfende Bilder zu erzeugen, und es durch die Akzeptanz von ausschließlich englischer Sprache zu einem Bias-Effekt (Verzerrung) kommen kann, was Vorteile fördert. Über diese Risiken schreibt Spiegel-Autor Jörg Breithut hier ausführlicher.
Fazit
Was soll ich sagen? Alles in allem sind Programme wie DALL-E eine witzige Spielerei und für mich als kreative Person unglaublich inspirierend und zeitsparend. Ich schmunzle über die vielen skurrilen Ergebnisse und habe Spaß daran, zu beobachten, wie eine kleine Anpassung meiner Begriffe, die Ergebnisse beeinflusst.
Aber vor allem bei besonders beeindruckenden Werken, die Art von Arbeiten, die ich wohl auf Instagram liken und abspeichern würde, habe ich Bauchschmerzen, weil ich es nicht mag, dass hier Künstlerinnen und Künstler ausgebeutet werden, von denen ich wahrscheinlich nicht mal weiß, dass sie existieren.
Ich würde mir wünschen, dass Firmen wie OpenAI einen Weg finden, um auch die Menschen zu würdigen, mit deren Kunst ihre Programme trainiert werden. Denn ohne diese Arbeiten, in die viel Zeit und Liebe floss, gäbe es schließlich auch keine AI-Kunst.
Wie seht ihr das mit der KI-Kunst? Wurde etwas übersehen? Gibt es Punkte, an denen ihr widersprecht? Wir würden uns freuen, eure Gedanken dazu in den Kommentaren zu lesen!