Alle schieben – aber ins Leere?!
Ein Sommerblog über Bild-KI zwischen Ausdruckskraft und Absurdität
Juli 2025
Eine simple Idee: Menschen bringen gemeinsam einen Felsbrocken voran – ein Sinnbild für partizipative Führung. Die Umsetzung mit Bild-KI? Ein Abenteuer in mehreren Akten. Plötzlich schlingert der Stein autonom durch die Luft, das Team schiebt ins Leere, und die dezent skizzierte Führungsperson gerät zur übergrossen Comicfigur. Was als Illustration für partizipative Prozesse begann, wurde zum Prompt-Parcours mit absurder Ästhetik. Dieser Blog erzählt, wie künstliche Intelligenz auf der grafischen Ebene physikalische Gesetze missachtet – und warum es Geduld, Sprache und Humor braucht, um die Kontrolle über das Bild zurückzuerlangen.
Wie führe ich – und wie bringe ich ein Projekt zum Ziel? Wie bringen wir den Felsbrocken ins Rollen? Indem wir gemeinsam ziehen und schieben – und einander zuhören. Klingt einfach – zumindest in der realen Welt.
In der Welt der Bild-KI kann daraus ein überraschendes Abenteuer werden.
Gemeinsam kommen wir vorwärts
Die Idee: Ich wollte eine Szene illustrieren, in der mehrere Menschen gemeinsam einen schweren Felsbrocken vorwärts bewegen – als Sinnbild für Kooperation, gemeinsame Kraft und partizipative Prozesse. Der Stil war schnell definiert: sepiafarben, feine Linien, Vintage-Comic. Mit dieser Ästhetik hatte ich gute Erfahrungen gemacht. Doch was dann geschah, war aufschlussreicher als jede fertige Illustration.
Die erste Bildgeneration war optisch recht vielversprechend. Zwei Figuren zogen gemeinsam an einem Seil – aber Achtung: Wären wir nicht gleich alle vom Fels überrollt worden? Eine weitere Person zog mit aller Kraft ins Nichts, während ein Kollege in die Gegenrichtung stieß. Physikalisch unmöglich – inhaltlich absurd. Und der nächste Versuch war nicht viel besser.
Klare Anweisungen, auch über die Verhältnisse
In späteren Varianten wurde der Block hochgehoben, als wäre er aus Meringue. Gleichzeitig zog ein Seil in entgegengesetzter Richtung – nicht befestigt, aber trotzdem gespannt. Also: Komplexität reduzieren, das Seil weglassen. Alle sollten mit voller Kraft schieben – mit sichtbarer Anstrengung und einem Hauch von Begeisterung. Denn gemeinsam schaffen wir das!
Mimik und Bewegung wurden wichtiger als technische Details.
Nichts als Karikaturen
Doch meine Illustration zur partizipativen Führung geriet zur Karikatur: Alle schoben mit ganzer Kraft – ins Leere. Und der Felsblock? Schwebte in der Luft, rollend voran. Ich lachte laut. In einem echten Comic hätte ich mir die Haare gerauft. Oder mir wären Schweissperlen auf der Stirn gestanden – oder Tränen die Wange heruntergekullert.
Natürlich ist es nicht fair, KI mit menschlichem Weltwissen zu messen. Ein Bildmodell erkennt Muster in Millionen von Bildern – aber es versteht (noch) nicht, dass ein Objekt Gewicht hat. Dass ein Seil nur auf Zug funktioniert. Oder dass Menschen gemeinsam auf ein Ziel hinarbeiten können, ohne zu Klonen zu werden. Nicht alle Frauen haben kurze Haare, tragen Perlenketten und Ohrringe!
Logik und Stil in Einklang bringen
Einzelporträts funktionierten erstaunlich gut. Bin ich das? Ja doch, es hat etwas. Doch bei Gruppenszenen drifteten die Figuren stilistisch auseinander. Die Mimik war überzeichnet, die Lippen blutleer, die Perspektiven unstimmig. Und von partizipativer Führung? Keine Spur. Im Gegenteil: Plötzlich war eine Person dominanter, grösser – offenbar nur, weil im Prompt das Wort „Führung“ vorkam.
Präzise Anweisungen im Prompt
Was war das noch gleich mit dem berühmten Bild des Felsblocks, an dem die einen ziehen und die anderen schieben? Erst nach zahlreichen präzisen Prompt-Anpassungen und vielen misslungenen Versuchen entstand ein Bild, das der Idee ziemlich gerecht wurde: Menschen, die gemeinsam und glaubhaft denselben Felsbrocken bewegen. Jede und jeder individuell gezeichnet, aber einigermassen im selben Stil. Mit klarer Mimik, Aktion und Ausdruck.
Kein Seil. Kein Schweben. Keine Meringue. Keine Karikatur. Endlich. Ich hoffe, der Felsblock kommt ins Rollen! Wär doch schön, nicht wahr?
Was bleibt?
Künstliche Intelligenz ist kein Ersatz für Vorstellungskraft. Aber sie kann eine kreative Partnerin sein – wenn man geduldig bleibt, nachjustiert, lacht und wieder neu ansetzt. Die Qualität eines Bildes liegt nicht allein in der Technik, sondern in der Verbindung von Idee, Sprache und gestalterischem Gespür.
Der verbale Teil der KI – ChatGPT – hat das Anliegen verstanden.
Gemeinsam haben wir den Prompt so lange geschärft, bis das Bild entstand, das ich mir wünschte.
Und unterwegs wurden einige absurde Ergebnisse produziert, die für sich selbst sprechen.
Am Ende war auch das eine Form von Teamarbeit.
Oder vielleicht zeichne ich das nächste Mal doch wieder selbst.
Aber die Prompt-Vorlage stelle ich gerne hier zur Verfügung – auf Englisch, denn der grafische Teil von ChatGPT versteht das offenbar besser.
Prompt: A hand-drawn vintage-style sepia-toned ink illustration. Four people of different genders and ages are working together to push a huge stone block forward. All characters are positioned on the same side of the boulder, with their hands and bodies clearly leaning against it. Each person is in direct physical contact with the stone and shows visible effort in posture and expression. One woman wears a red scarf and pearl necklace. Faces are drawn in the same fine-line comic style: expressive but not exaggerated. No one is pulling. The stone rests firmly on the ground, slightly tilted forward, with movement implied. No background – focus entirely on the people and their shared action.
Es ist Sommer und Zeit zum Ausprobierenl! >> https://chatgpt.com/
©Claudia Appenzeller - mit Unterstützung von ChatGPT 40
Stand: Juni 2025. Der Beitrag wurde mit grosser Sorgfalt und nach aktuellem Wissensstand erstellt. Angesichts der Dynamik im Bereich Künstliche Intelligenz kann sich der Stand der Technik rasch weiterentwickeln.
Wiedergabe mit Quellenangabe (Autorin und Website) erlaubt. Für weitergehende Nutzungen bitte Kontakt aufnehmen.