Kann KI Graphic Recording? Ein Selbstversuch

Zugegeben: der Titel ist ein bisschen reisserisch. Natürlich kann (noch) keine künstliche Intelligenz sinnvolle Graphic Recordings erstellen. Da Adobe Illustrator seit kurzem aber interessante Bildgenerierungsfunktionen besitzt, wollte ich ausprobieren, ob und wie gut man diese vielleicht schon für Graphic Recordings nutzen kann. 

Ich wollte eigentlich „richtige“ Sketchnotes zu einem Vortrag erstellen, aber da ich mit der Technik noch so unvertraut bin, schien es mir zunächst leichter, ein bereits vorhandenes Bild nachzubauen. Daher habe ich versucht, meine VUCA-Illustration nachzubauen, bzw. nachbauen zu lassen.

Das Ergebnis:

Ki-generiert sind dabei nur die illustrativen Anteile. Texte habe ich per Hand hinzugefügt, ebenso die blaue Umrandung. Texte in Handlettering zu verwandeln kann zumindest Illustrator meines Wissens nach nicht. Außerdem habe ich das Bildmotiv aus vielen Einzelmotiven zusammengesetzt, die alle einzeln generiert wurden. Einmal als Prompt das Gesamtbild zu beschreiben hätte keine vernünftigen Ergebnisse geliefert. 

Das hat gut funktioniert

Prinzipiell ist es ziemlich toll, dass Illustrator Vektorgrafiken ohne Hintergrund ausgeben kann. Die generierten Elemente lassen sich dann frei verschieben oder bearbeiten. Gelegentlich habe ich Teile der Motive gelöscht, denn manchmal entstehen seltsame Formen, die keinen Zweck haben. Das kann man beispielsweise gut bei der Achterbahn und den rosa Formen im Hintergrund beobachten. Auch der Style-Picker funktionierte recht gut. Damit wird ein Referenzbild ausgewählt von dem Farben und ungefährer Stil übernommen wird. Dadurch wirkt alles aus einem Guss. 

Insgesamt ist die Illustration viel komplexer und aufwändiger als man selbst das in der Kürze der Zeit schaffen könnte. Dennoch muss ich aber dazusagen, dass teilweise schon sehr viel Zeit mit warten auf die Bildgenerierung verschwendet wird. Dazu aber im nächsten Abschnitt mehr.

Das hat weniger gut funktioniert

 

Leider ist die Qualität der Bildgenerierung oft ein Glücksspiel. Oft macht es Sinn, komplexere Motive aufzuteilen. Bei „Uncertainty“ habe ich erst Berge generieren lassen und danach einen Seiltänzer. Das hat erstaunlich gut geklappt – direkt im ersten Wurf war etwas Brauchbares dabei. Unerwartet schwierig war hingegen die Achterbahn. Ich fand einfach keine der erzeugten Bilder passend und habe mit verschiedenen Einstellungen (Generierung als Icon und als Bildmotiv, verschiedene Prompts und Detailgrade) herumexperimentiert bis irgendwann durch Zufall etwas halbwegs Gutes dabei war. Wirklich nachvollziehbar war dies für mich nicht. 

Das Problem mit der Zeit habe ich ja schon angerissen. Die vielen Fehlversuche kosten Zeit. Sehr viel Zeit in der man eigentlich auch nichts anderes machen kann. Für ein Live-Setting kann ich mir dies noch nicht vorstellen. Und da die Bildsprache deutlich komplexer ist als üblicherweise, kann man auch nicht „mal eben“ etwas dazuzeichnen, wenn die KI nichts Brauchbares liefert. Natürlich kann man die Geschwindigkeit mit etwas mehr Erfahrung noch verbessern (bessere Prompts schreiben, wissen, wo man Bilder aufteilen muss), aber richtig schnell fühlt es sich nicht an. 

Außerdem ist die Bildsprache/der Stil sehr eingeschränkt. Meines Wissens nach wird die Bildgenerierung mit Adobe Stock gefüttert – und meiner Meinung nach sehen die Bilder auch ein bisschen aus wie Stockillustrationen. Eine wirklich gute Kontrolle über das Ergebnis hat man nicht. Die Farbpalette lässt sich nicht auf bestimmte Farben festlegen, sondern nur auf eine Farbstimmung. 

Auch der Detailgrad lies sich nur sehr eingeschränkt steuern. Ich habe viele Versuche gemacht, am Ende noch ein paar Deko-Wölkchen hinzuzufügen. Auch mit der Icon-Einstellung und dem niedrigsten Detailgrad habe ich sehr komplexe Bilder erhalten, die sich als kleine Deko-Elemente nicht eigneten. Vielleicht kann man einen Workaround finden, indem man eine Szene mit vielen Wolken generiert und dann alles bis auf ein paar Wölkchen wieder löscht, aber eine richtig gute Lösung ist das nicht.

Unerwartet schwierig: Hier meine Versuche zum Begriff "Rollercoaster"

Fazit

Mein Experiment zeigte mir ganz klar: die Technologie steckt noch in den Kinderschuhen. Wirklich anwendbar für mehr als Spielereien ist es noch nicht oder erfordert mehr Training und einen besseren Workflow von meiner Seite aus. Dennoch kann man schon ein bisschen erahnen, wohin die Reise gehen könnte: dass wir beim Graphic Recording zukünftig eben nicht mehr alles zeichnen, sondern in Echtzeit wahnsinnig komplexe Bildwelten ausgeben können. Die Bildideen zu abstrakten Themen können natürlich auch (noch) nicht sinnvoll von KIs generiert werden und es braucht (noch) einen Menschen, der die Bildmotive  anordnet und miteinander verknüpft. 

Ich bin gespannt, wie sich die Technologie weiterentwickelt und wie wir in ein paar Jahren vielleicht schon ganz selbstverständlich damit arbeiten werden. 

About Anna Penkner

Anna Penkner ist Graphic Recorderin und Illustratorin. Mit Leidenschaft kreiert sie neue Bildkonzepte, die sowohl informativ als auch optisch ansprechend sind. 2017 machte sie ihren Master in Illustration an der HAW Hamburg und gründete 2014 zusammen mit Renate Pommerening das Designdoppel. Annas Schwäche sind ihre winzigen Hände. Wie sie damit Berge erklimmen, Klavier spielen und Artikel schreiben kann, weiß niemand so genau. Aber sie tut es!