Ein Bild sagt mehr als 1.000 Worte. Zumindest online scheint dieser Spruch zutreffend zu sein. Visueller Content ist wichtig, wenn du die Aufmerksamkeit deiner Zielgruppe erregen willst. Du benötigst Bilder auf all deinen Kanälen: Deiner Website, Social Media, im Newsletter, etc. Ohne Bilder geht es nicht.
Doch was, wenn du inhouse keinen Designer hast oder dieser ausgelastet ist? Hier verspricht künstliche Intelligenz Abhilfe zu schaffen. Entscheidend für ein gutes Ergebnis ist der richtige Befehl. Deshalb erklären wir dir, wie du Prompts für KI-Bilder formulierst und worauf du sonst noch achten musst.
Wie kannst du KI-Bilder verwenden?
Vorab sei gesagt, dass wir dir nicht raten würden, all deine Bilder durch eine KI generieren zu lassen. Dafür sind die Tools noch nicht ausgereift genug und es mogeln sich zu viele Fehler in die Bilder. Wenn du nicht aufpasst, kann das schnell mal peinlich werden. Außerdem könnte es schwer sein, einen konsistenten Markenauftritt zu gewährleisten. Weiter kann es zu rechtlichen Problemen kommen, da die derzeitige Lage insbesondere in Bezug auf das Urheberrecht nach wie vor unklar ist. Weiter unten gehen wir etwas weiter darauf ein.
Es gibt aber durchaus Fälle, wo es nützlich sein kann, Bilder durch KI generieren zu lassen. Vielleicht benötigst du ein Bild für eine Anzeige, einen Social-Media-Post oder einen Flyer. Hier ist es unter Umständen schneller eine künstliche Intelligenz zu beauftragen, anstatt deinen Designer zu briefen und mehrere Feedback-Schleifen zu durchlaufen.
Welche Tools gibt es?
Midjourney
Midjourney ist derzeit wohl das beliebteste Bild-KI-Tool am Markt. Es gibt keine Free Version und außerdem benötigst du zwingend einen Discord-Account. Mit dem Befehl “/imagine” legst du los und kannst deinen Prompt formulieren. Es werden vier Bilder gleichzeitig generiert.
Daneben gibt es einige weitere Parameter, die du angeben und miteinbeziehen kannst:
--no: schließt Objekte aus. Schreibst du z. B.”--no cars” werden auf dem Bild keine Autos zu sehen sein.
--ar: gibt das Seitenverhältnis an. Du kannst z. B. mit --ar 16:9 das reguläre horizontale Bildverhältnis festlegen. Mit --ar 9:16 bekommst du das Bild in vertikaler Ausrichtung.
--s: legt fest, wie stilisiert das Ergebnis ist. Du kannst einen Wert zwischen 0 und 1.000 wählen. Je höher der wert, desto stilisierter ist das Ergebnis.
--chaos: gibt an, wie sehr sich die gleichzeitig generierten Bilder unterscheiden. Du kannst hier einen Wert zwischen 0 und 100 wählen, je höher, desto stärker die Unterschiede.
Es gibt noch einige weitere Parameter, die du nutzen kannst, um bessere Ergebnisse zu erzielen. Außerdem kannst du mittels eines Permutation Prompts Variablen in deine Bilder einbauen. Schreibe die Aufträge dafür in geschweifte Klammern und trenne sie mit Kommas voneinander. Du kannst so z. B. unterschiedliche Farben oder Orte austesten. Der Prompt könnte dann so aussehen: /imagine a {blonde, brunette} woman oder /imagine a man in the {streets, forest, desert}.
Neben der Text-zu-Bild-Funktion verfügt Midjourney darüber hinaus noch über ein Bild-zu-Bild-Feature. Du kannst hier zwei Bilder hochladen und miteinander kombinieren oder du lädst nur eines hoch und formulierst in einem Prompt, wie es verändert werden soll. Dabei solltest du aber besonders auf die Bildrechte aufpassen.
DALL-E
DALL-E ist die Bild-KI von Open AI. Damit kannst du dir in ChatGPT zu deinen Texten direkt noch Bilder erstellen lassen. Du kannst so zwei Fliegen mit einer Klappe schlagen. Derzeit kannst du DALL-E nur in GPT 4 benutzen und es gibt keine kostenlose Variante.
Für gute Ergebnisse beschreibe die Stimmung, um das richtige Gefühl zu erzeugen. Dazu gehört auch die Lichtverhältnisse oder die Tageszeit zu beschreiben. Außerdem kannst du DALL-E ebenfalls dazu auffordern, Dinge aus deinen Bildern auszuschließen oder keine eigenständigen Details zu ergänzen. Sollen Gruppen von Personen abgebildet werde, sage DALL-E wie viele, da der Bot sonst dazu neigt, möglichst viele Menschen in ein Bild zu pressen.
DALL-E hat den Nachteil, dass es dir per Default quadratische Bilder ausgibt. Andere Seitenverhältnisse im Prompt zu bestimmen, funktioniert nur mäßig.
Stable Diffusion
Stable Diffusion ist ein Open-Source-Tool von Stability AI. Im Free Plan kannst du dir zwei Bilder gleichzeitig generieren lassen. Im Premium-Abo hast du die Wahl zwischen vier Bildern. Diese werden für sieben Tage gespeichert.
Du hast auch die Möglichkeit, Bilder hochzuladen und diese dann umwandeln zu lassen. Das funktioniert unserer Erfahrung nach allerdings weniger gut. Falls du es dennoch versuchen möchtest, solltest du hier auch vorsichtshalber die Bildrechte abklären.
Achte bei deinen Prompts darauf, dass Stable Diffusion bisher nur englische Buchstaben erkennt. Du kannst deinen Prompt zwar auf deutsch formulieren, musst aber Umlaute oder das scharfe S durch Umschreibungen ersetzen. Außerdem werden die Bilder in der Free Version mit einem Wasserzeichen versehen.
Canva Magic Media
In der Pro Version von Canva kannst du dir ebenfalls Bilder KI generieren lassen. Canva stützt sich dabei ebenfalls auf Stable Diffusion. Der Vorteil hier ist, dass du hier vier Bilder gleichzeitig generieren kannst. Außerdem verfügt Canva über eine DALL-E-Integration. Du kannst also beide KIs nutzen und schauen, welche für dich besser funktioniert.
Canva verfügt darüber hinaus auch über ein Tool zur Textgeneration. Du kannst dir zu deinen Bildern direkt die passenden Captions verfassen lassen, wenn du möchtest.
Wenn du mehr über Canva Magic Media erfahren möchtest, schau dir gern unser Video dazu an:
3 Dinge, die du bei Prompts für KI-Bilder beachten solltest
Hast du dich für ein Tool entschieden, kannst du endlich loslegen. Damit dir die Content-Erstellung gelingt, musst du einen guten Prompt schreiben. Wir erklären dir, wie es geht.
Bestimme den Stil
Möchtest du ein Bild, das wie ein Foto aussieht, musst du das in deinen Prompt schreiben. Sonst wirst du immer Bilder bekommen, die wie Illustrationen aussehen. Darüber hinaus gibt es verschiedene Fotografie- oder Zeichenstile, die du näher bestimmen kannst. Manche Tools geben dir auch eine Auswahl an Stilen, von denen du einen aussuchen kannst.
Vermeide gewisse Körperteile
Wenn du fotorealisitsche Bilder von Menschen benötigst, bist du mit einer Stock-Datenbank grundsätzlich besser beraten. Willst du aber wirklich unbedingt KI-Bilder erstellen lassen, achte darauf, dass idealerweise keine Hände oder Ohren darauf zu sehen sind. Auch Zähne führen zu Problemen und selbst die Augen sehen teilweise verschwommen aus oder haben unterschiedliche Farben.
Du wirst genau hinsehen müssen, um sicher ein Bild zu bekommen, dass stimmig aussieht. Ein weniger realistischer Stil kann hier Abhilfe schaffen.
Sei konkret und nutze Adjektive
Je genauer du beschreibst, wie du dir dein Bild vorstellst, desto besser. Es macht einen Unterschied, ob du einfach nur eine “lächelnde Frau vor einem neutralen Hintergrund” anfragst, oder ob du die Farben, die Kleidung, die Gegenstände im Bild näher beschreibst. Ist die Frau blond oder brünett? Wie alt ungefähr? Trägt sie eine Brille? Einen Blazer? Ist das Bild eher in warmen oder kühlen Tönen gehalten? Oder vielleicht sogar schwarz-weiß?
All diese Dinge solltest du dir vorher überlegen, um Zeit zu sparen. Ansonsten musst du das Bild immer wieder neu generieren lassen, bis die gewünschten Details vollständig vorhanden sind. Mach dir ein paar Gedanken darüber, was dir wichtig ist, wen das Bild ansprechen soll und wie deine Marke visuell repräsentiert wird. Beschreibe deine Vorstellungen dann möglichst konkret und nutze passende Adjektive, um die richtige Atmosphäre zu erzeugen.
Nachteile von KIs zur Bildgenerierung
Es gibt einige Probleme, die unabhängig von gutem Prompting bei der Bildgenerierung auftreten können. Diese sollten dir bewusst sein, bevor du mit dem Erstellen beginnst.
Bildrechte
Wir haben es bereits angeschnitten: Wenn du Bilder von künstlicher Intelligenz erstellen lässt, heißt das nicht, dass du automatisch alle Rechte daran hast. Es kommt darauf an, was auf den Bildern zu sehen ist. Sind beispielsweise Logos abgebildet, kann das problematisch werden.
Außerdem ist zwischen Nutzungs- und Urheberrechten zu unterscheiden. Um wirklich auf der sicheren Seite zu sein, solltest du dich umfassend informieren und gegebenenfalls eine Rechtsberatung in Betracht ziehen.
Weitere Details liest du in unserem Artikel, oder du schaust dir unser Video an:
Uncanny Valley
Bei Bildern von Personen gibt es wie schon genannt ein paar Fallstricke, auf die du Acht geben musst. Doch selbst wenn du diese eliminiert hast und ein anatomisch korrektes Ergebnis erhalten hast, haftet KI-Bildern zuweilen etwas Unwirkliches an. Du kannst es nicht genau benennen, aber irgendetwas stimmt nicht.
Dieser Effekt ist als “Uncanny Valley” bekannt. Ein bekanntes Beispiel ist der Animationsfilm Polarexpress, bei dem die Figuren des Films keine Akzeptanz durch das Publikum erfuhren. Deshalb sind in Animationsfilmen häufig Tiere oder andere nicht-menschliche Wesen zu sehen, um den Effekt zu umgehen. Eine weitere Methode sind Animationsstile, die weniger fotorealistisch sind.
Überlege dir also gut, ob du wirklich Menschen durch KI darstellen lassen möchtest, denn sie bringen eine Reihe an Problemen mit sich. Es kann zu anatomischen Unstimmigkeiten kommen, der Uncanny-Valley-Effekt wird ausgelöst werden, oder möglicherweise verletzt du unwissentlich das Persönlichkeitsrecht von jemandem.
Trial and Error
Es klingt so einfach: Ich beschreibe in ein paar Worten, wie das Bild auszusehen hat und in wenigen Sekunden erhalte ich ein Ergebnis, das genau meinen Vorstellungen entspricht. Kein ewiges Hin und Her, keine Feedbackschleifen. Die Realität sieht leider anders aus.
KI-Tools können durchaus solide Ergebnisse liefern, oft werden sie aber nicht dem entsprechen, was du dir eigentlich gewünscht hast. Ein Designer, der deine Brand kennt und mit dem du zuvor schon gearbeitet hast, kann deine Vorstellungen sehr viel präziser umsetzen und versteht deine Vision besser, als eine KI es kann. Er kann auch individuell auf dein Feedback eingehen und versteht deine Änderungswünsche besser.
Willst du trotzdem auf KI-Tools setzen, wirst du herumprobieren müssen. Einige Fehler musst du unter Umständen trotzdem manuell ausbessern.
Der Teufel steckt im Detail
Neben zusätzlichen Fingern oder ungleichen Augen, gibt es oft weniger offensichtliche Fehler, die sich in KI-generierte Bilder schleichen. Gerade wenn viele Gegenstände abgebildet sind, können Fehler schnell mal untergehen. Wenn du das Bild dann ohne nochmalige Kontrolle veröffentlichst und der Fehler bemerkt wird, wirkt das unprofessionell. Deshalb solltest du immer ganz genau hinsehen.
Fazit
Bild-KIs leisten bereits einiges und kommen auch immer häufiger zum Einsatz. Wenn es mal schnell gehen muss oder du was Neues austesten möchtest, kann es zeitsparender sein, auf solche Tools zurückzugreifen. Außerdem schadet es nie am Puls der Zeit zu bleiben. Probiere dich also ruhig aus.
Sei dir aber der Nachteile und vor allem der möglichen rechtlichen Probleme bewusst. Informiere dich und wäge das Für und Wider ab, bevor du KI-Inhalte veröffentlichst.
Wenn du dich dafür entscheidest, dann benötigst du einen Ort, an dem du Bilder sicher ablegen und organisieren kannst. Hier kann dir das DAM von pixx.io behilflich sein. Teste jetzt pixx.io 14 Tage kostenlos und speichere deine KI-Bilder zentral in der Cloud.
Valerie
Valerie wollte immer "irgendwas mit Medien" machen, ist aber stattdessen im Germanistik-Studium gelandet. Dadurch hat sie ihr Interesse an Sprache entdeckt. Ihre Arbeit als Content Editor bei pixx.io erlaubt ihr beides zu kombinieren - Sprache und Medien.