Dasfotoportal.de (dfp): Christoph, Worum geht es in Deinem neuen Buch „Promptologie“?
Christoph Künne (CK): Um künstliche Intelligenz beziehungsweise, um ihre Anwendung in der kreativen Bildbearbeitung.
dfp: Wie siehst du dabei das Verhältnis zur Fotografie?
CK: Die Ergebnisse der Promptologie sehen vielleicht manchmal aus wie Fotografien. Sie werden aber nicht wie Fotografien gemacht. Ich finde es sinnvoll, die Fotografie und die Promptologie zu trennen, denn eigentlich hat nur das Resultat etwas mit der Fotografie zu tun, weil es im Ergebnis einem Foto sehr ähnlich ist. Im Wesentlichen ist generative KI eher eine Form des Malens und zwar mit Worten. Deswegen liegt die generative Bilder-KI der Malerei näher als der Fotografie.
dfp: Wie steht es denn bei der Promptologie um die Kreativität? Wird diese dort der Maschine überlassen, beziehungsweise welchen kreativen Einfluss hat derjenige, der sie bedient, sprich in diesem Fall mit Worten füttert?
CK: Je nachdem, in welcher Form er sie benutzt und welche Menge an Worten er verwendet oder in welcher Form das System sie interpretiert und ob es mit kurzen oder langen Prompts umgehen kann und auch wie es das tut. Es kommt also auf die Rahmenbedingungen an. Hat man eine gewisse Kontrolle darüber? Je weniger Worte ich eingebe, je mehr Freiheit lasse ich der Maschine. Wenn ich ihr viel Freiheit gebe, habe ich relativ wenig kreativen Input. Wenn ich aber alles sehr genau ausbuchstabiere und die Maschine macht das dann auch, dann bekomme ich eine relativ hohe Kontrolle. Das heißt, je mehr Parameter ich vorgebe, wie beispielsweise Licht, Brennweiten, Blickwinkel oder Stile, umso größer wird mein Einfluss auf das Ergebnis.Somit habe ich schon einen gewisse Kontrolle über die Bildinhalte und auch einen Einfluss auf das Ergebnis. Aber es ist natürlich nicht so, als ob ich das Bild malen würde oder wie wenn ich es inszeniere, um es dann zu fotografieren. Da ist also ein qualitativer Unterschied und der ist vom Ergebnis her nicht unbedingt erkennbar.
dfp: An wen wendet sich dein Buch also? Im Grunde weiß ja zurzeit kaum jemand richtig Bescheid. Jeder kennt den Begriff KI. Doch die Wenigsten können sich darunter etwas Konkretes vorstellen, geschweige denn die Technik nutzen?
CK: Es richtet sich eigentlich an alle Kreativen, die sich dafür interessieren oder auch beruflich damit zu tun haben. An jene, die sich damit auseinandersetzen müssen, wie ihnen dieses neue Werkzeug bei ihren Workflows weiter hilft, wie es diese optimiert und wie sie damit ihre kreativen Möglichkeiten vergrößern können.
Also eigentlich sollte sich jeder damit befassen, der Bilder macht. Und ganz besonders diejenigen, die damit ihr Geld verdienen. Damit sie diese Werkzeuge möglichst schon im Frühstadium kennenlernen, um später die komplexeren Möglichkeiten besser beherrschen zu können.
dfp: Geht es vor allem um kommerzielle oder künstlerisch kreative Anwendungen?
CK: Das ist relativ vielschichtig. Auf der einen Seite fängt es damit an, dass man damit sehr schnell Dinge illustrieren kann. Ich habe das im eigenen Berufsleben ja ständig. Regelmäßig muss ich irgendwelche Artikel, die ich geschrieben habe, mit einem Bild versehen, um sie interessanter zu machen. Dazu suche ich oder habe ich bisher sehr lange in den Angeboten der Stockagenturen oder in meinem eigenen Bildarchiv gesucht. Häufig sogar länger als fürs Schreiben. Das kann ich jetzt relativ stark verkürzen, weil ich halt die Eingaben, die ich bei den Stockagenturen in die Datenbank-Suche mache, jetzt kurzer Hand per generativer KI gleich in ein Bild umgeformt habe. An so einer Stelle ist diese neue Technik des Bildermachens beruflich unendlich praktisch.
dfp: Worin unterscheiden sich denn hier die Herangehensweisen eines professionellen Fotografen bei der Ausführung eines Kundenauftrags und die der Illustration mit KI?
CK: Aus der Perspektive des Fotografen betrachtet, benötige ich eine andere Anmutung in dem Moment, wo das Bild werblich ist. Beispielsweise in der Fashion-Fotografie. Dabei kommt es darauf an eine Emotion zu transportieren. Soll diese Emotion aber ein ganz bestimmter Turnschuh transportieren, wird es bei KI noch etwas schwierig, weil ja genau dieser Turnschuh im Bild sein soll und nicht nur irgendein Turnschuh.
Bei einem Kleidungsstück ist es noch schwieriger. Doch auch da wird es sicherlich relativ schnell gehen, dass man nicht mehr nur mit reinen sprachlich generierten Bildern arbeitet, sondern für fotografische Bilder Hintergrundbildwelten per Sprache kreiert. Dass man etwa mit Kleidung behängte 3D-Elemente vorgibt und dann den Rest des Bildes von der Maschine ausrechnen lässt.
dfp: Heißt das, man gibt der KI nicht nur Texte sondern auch Bilder vor?
CK: Ja, indem ich beispielsweise einfach einen Schnappschuss von dem Turnschuh mache. Dann kann sich die KI ausrechnen, wie der wirklich aussieht und stellt ihn anschließend in einer attraktiven Form und in einer ansprechenden Umgebung dar. Dafür gibt es verschiedene Ansätze. Einer ist, dass ich sage, ich denke mir erst eine KI-Welt aus – ohne Menschen. Nehmen wir mal so eine subtropische, moderne Stadtszene, wo die Häuser mit grünen Pflanzen behängt sind und daher interessant aussehen. Also eine Welt, die spannend ist, die man so aber nicht fotografieren kann, weil es sie gar nicht gibt. Oder zumindest nicht da, wo ich bin. Anschließend sollen auch Menschen darin vorkommen, die diese besagten Turnschuhe tragen. Dafür gibt es bereits jetzt KI-Werkzeuge, wo ich mir dieses Bild ausdenke und es als Hintergrund hinterlege, um dann – wie schon gesagt – entsprechende 3D Objekte hinein zu laden. So, wie man das aus der 3D-Welt kennt: Puppen, die ich arrangiere mit der gewünschten Armhaltung, Beinhaltung oder Handhaltung. Dann könnte ich zum Beispiel für so eine Puppe definieren: Du bist Marilyn Monroe und hast Turnschuhe an.
dfp: Werden so Workflows in nicht allzu ferner Zukunft ablaufen?
CK: Sehr Wahrscheinlich ja! Aber das lernt man noch nicht in meinem Buch, weil es noch nicht so alltagstauglich funktioniert.
dfp: Gibt es denn in dem Buch Hinweise auf Software, die man bereits benutzen kann?
CK: Ja, die aktuellen Systeme haben wir uns natürlich angeschaut. Und zwar nicht nur die bekanntesten wie Midjourney oder Dall-E, sondern auch Stable Diffusion und viele spezialisierte KI-Tools für Fotokreative. Darum dreht sich ein relativ großer Teil des Buches. Es geht nicht so sehr darum, welche Prompts toll sind. Das ist aus meiner Sicht eher langweilig, sondern vielmehr zeigen wir, wie man, wenn man, wenn man ein Thema hat, dieses mit vier, fünf oder sechs Schritten umsetzt. Und wir zeigen und erklären auch, was dabei schiefgehen kann und warum.
Es handelt sich also im Prinzip um „Begleitreportagen“ in Kurzform für kleinere KI-Projekte. Das Buch besteht aus drei Teilen: Hintergrundwissen, um zu erkennen, warum Fehler gemacht werden und wie Bilder entstehen. Teil zwei behandelt die erwähnte Projekt-Praxis und der dritte Teil ist dann der eher auf die Hilfswerkzeuge für den fotografischen Workflow konzentriert.
dfp: Betrifft der dann auch Anwendungen in der Berufsfotografie?
CK: Ja und zwar sehr konkret. Man erfährt, wie man KI schon jetzt in der kommerziellen Bildbearbeitung einsetzen kann. Was es also bereits an effektiven KI trainierten Werkzeugen gibt. Etwa solche, die in der Lage sind, Hautretuschen auf wirklich extrem hohem Niveau innerhalb von Sekunden vorzunehmen. Es gibt aber auch Standard-Werkzeuge, die beispielsweise per Mausklick den Himmel im Foto austauschen. Wir zeigen auf, was es dazu aktuell an Software gibt und erklären, was ein Programm kann und wie es funktioniert.
dfp: Du hast eingangs gesagt, Generative KI sei keine Fotografie. Aber Du empfiehlst sie als effektives Werkzeug gerade für die kommerzielle Fotografie. Liegt darin nicht ein Widerspruch und wo ist die Schnittstelle?
CK: Es werden auch viele andere kreative Menschen generative KI einsetzen und brauchen. Es sind Illustrationen, die Fotografien täuschend ähnlich sehen. Generative KI hat ja in Standardprogrammen für die professionelle Fotografie wie Photoshop längst Einzug gehalten. Deshalb wird sie dort zwangsläufig auch genutzt werden. Im Moment sehe ich die Schnittstelle eigentlich darin, dass sich fotografische Bilder per KI erweitern und optimieren lassen, dass man damit Retuschen vornehmen kann. Vornehmlich solche, für die man vorher sehr viel Zeit aufwenden musste. So kann man sagen, jemand der auf einem Foto eine Kaffeetasse in der Hand hat, solle stattdessen ein Smartphone halten. Das sind Anwendungen, die jetzt schon mit generativer KI möglich sind.
dfp: Das klingt alles sehr professionell und tiefergehend. Ist das Buch ehr für Einsteiger oder für Fortgeschrittene?
CK: Ich sehe es eigentlich für Interessenten jeden Levels. Im Augenblick herrscht ja ein ziemliches Durcheinander dabei, wie der Begriff KI benutzt wird. Deshalb habe ich es so angelegt, dass auch Menschen ohne Vorkenntnisse angesprochen werden. Aber KI ist ein sehr dynamisches Thema und wir verfolgen es ja parallel zu diesem Buch in unserer Zeitschrift DOCMA. Dort finden sich regelmäßig Berichte über die Weiterentwicklung von generativer KI. Seit Jahren befassen wir uns mit den Bildbearbeitungsprogrammen Photoshop und Lightroom sowie damit, wie man die digitalen Aspekte der Fotografie in den Griff bekommt. Da hat sich für uns natürlich auch das Thema KI angeboten. Das Bildermachen und die Bildbearbeitung waren stets das Hauptthema. Jetzt kommt eben auch noch das Bildererfinden hinzu. Darum dreht sich augenblicklich schwerpunktmäßig unsere Berichterstattung. Ein kleiner Nachteil liegt darin, dass wir nur alle drei Monate erscheinen und die Entwicklung zurzeit quasi im Wochentakt voranschreitet. Das wird sich wahrscheinlich demnächst wieder etwas beruhigen. Also werden wir deswegen die Erscheinungsweise langfristig nicht umstellen. Im Grunde genommen erlaubt der Dreimonatsstatus auch eine gründlichere Auseinandersetzung mit dem, was gerade passiert. Darauf haben wir als Redaktion immer sehr viel Wert gelegt.
dfp: Danke für das Gespräch Christoph und viel Erfolg mit deinem Buch und dem DOCMA-Magazin.
Promptologie
Was Kreative jetzt über Bild-KI wissen müssen.
Verlag DOCMA
Christoph Künne, Herausgeber
Mitautoren
Olaf Giermann
Michael J. Hußmann
Doc Baumann
Hardcover
180 Seiten
21,0 cm x 29,7 cm
Auch als eBook (PDF) erhältlich
Preis: 49,95 Euro (epaper 39,99) zzgl. Versand
Hinweis: Der Preis bezeiht sich auf das Angebot im DOCMA Webshop. Im Buchhandel kostet es dagegen dagegen 99,90 Euro.