Adobe Firefly im Test: Bilder auf Knopfdruck, kann das gutgehen?

Bilder erstellen oder erweitern nach einer kurzen Texteingabe. Das soll schlaue KI wie Adobe Firefly können. In der Praxis hapert’s aber noch.

Adobe Firefly im Test: Bilder auf Knopfdruck, kann das gutgehen?

KI-Generatoren sind derzeit in aller Munde und das Hype-Thema des Jahres schlechthin. Mit Firefly wirft Branchenschwergewicht Adobe seinen Hut in den Ring. Die KI kommt in Photoshop, Adobe Express und alsbald in anderen Produkten zum Einsatz. Zeit, die Software einem Härtetest zu unterziehen.

Inhalt:

Adobe mit einem Rechte-Versprechen

Bei aller Begeisterung kommen die Schattenseiten etwas zu kurz. Online verfügbare Bild-KIs trainieren beispielsweise mit im Netz auffindbaren Werken anderer Künstler. Dass die nicht begeistert sind, zeigen die unzähligen anhängigen Klagen.

Auftritt Adobe: Das Photoshop-Unternehmen bietet seit einigen Wochen mi Firefly eine alternativ Bild-KI an, die nur mit Fotos und Werken trainierte, die Adobe gehören. Der Hersteller verspricht daher, dass alle generierten Werke ohne Einschränkungen und juristischen Probleme kommerzielle verwendbar seien.

Das Eine ist die Verwertung. Das Andere die Qualität. Und da hat Adobe noch zu kämpfen…

Eine Beta ist eine Beta ist eine Beta

Zunächst: Firefly ist noch gar nicht offiziell veröffentlicht. Adobe-Kunden, welche die Creative Cloud kostenpflichtig abonniert haben, können Firefly aber vorab in einer Beta-Version von Photoshop und auch online in Adobe Express testen. Zunächst konzentrieren wir uns auf Photoshop und wollen bestehende Fotos abändern oder um neue Bildelemente ergänzen.

Adobe Firefly ist nur in der Photoshop-Beta verfügbar
Adobe Firefly ist nur in der Photoshop-Beta und in Adobe Express verfügbar. (Mit Material von Adobe)

Der Programm-Start läuft wie gewohnt ab – Photoshop-Nutzer laden auch fast automatisch ein erstes Bild ins Programm. Für unseren Fall haben wir uns für ein frisch aufgenommenes RAW-Foto der Annaberger Kät 2023 entschieden. Genauer: Das abschließende Feuerwerk „Sinfonie der Farben“.

Wie üblich gehen wir zunächst die RAW-Bearbeitung durch. Lädst du ein anderes Format wie JPG oder PNG ins Programm, entfällt dieser Schritt. Auf den ersten Blick sieht die Bearbeitungsmaske auch gewöhnlich auf.

Auf den zweiten Blick sticht ein neues Kontextmenü ins Auge, das ständig eingeblendet ist, im Bild unten rot eingerahmt.

Eine der Neuerungen ist die eingeblendete Kontextleiste. (Screenshot und Foto: Daniel Wendorf)
Eine der Neuerungen ist die eingeblendete Kontextleiste. (Screenshot und Foto: Daniel Wendorf)

Die Leiste erlaubt dir, sofort den Hintergrund auszutauschen (was ein alter Photoshop-Hut ist) und ein Motiv auszuwählen.

Um Firefly im Programm aufzurufen, müssen wir aber ein Objekt per Auswahl selektiere oder eine neue Ebene generieren und dann mit dem Auswahl-Werkzeug einen Bereich definieren.

Daraufhin erscheint mit „Generative Füllung“ eine neue Schaltfläche, über die wir das Objekt beschreiben können. Das klappt zunächst nur auf Englisch. Wir wollten einen Zeppelin in den Nachthimmel setzen. Also definierten wir den Prompt, wie auch in anderen Bild-Generatoren: „A Zeppelin floating in the night sky. Color this Zeppelin in black and white.“

Ein Albtraum von Zeppelin

Was Adobe daraus schuf, könnte einem Fiebertraum entsprungen sein. Pro bestätigtem Prompt generierte das Programm drei Variationen. Keine davon zeigte einen Zeppelin. Selbst nach mehrmaligem Durchlauf waren die Ergebnisse erschreckend weit von einer organischen Bildkomposition entfernt und zeigte Firefly alles, nur keinen Zeppelin:

Die Ergebnisse waren nicht nur falsch im Sinne des dargestellten Objekts. Sie fügten sich auch überhaupt nicht organisch in das Bild ein. Die Aufnahme oben mit ihren dominanten Farben in der Bildmitte und dem dunklen Rest schien für die KI schwer bis gar nicht analysierbar zu sein.

Also auf zu einem zweiten Versuch.

Architektur herbeizaubern

Für den zweiten Versuch nahm ich etwas, das Adobe aus seinen Trainingsdaten kennen sollte: den Dresdner Zwinger. Hier das Ausgangsfoto aus einer Canon EOS 750D:

Dresdner Zwinger
Das Ausgangsmaterial zeigt den Dresdner Zwinger. (Foto: Daniel Wendorf)

Zunächst wollte ich auf der ovalen Grasfläche links im Bild einen weiteren Springbrunnen stellen. Virtuell, versteht sich. Zunächst zog ich ein Auswahlrechteck dort auf, wo der Brunnen stehen sollte und gab dann einen simplen Prompt ein: „baroque fountain“.

Die drei Ergebnisse spuckte Firefly in wenigen Sekunden aus:

Perfekt waren sie nicht, obwohl Perspektive und Beleuchtung authentisch waren. Für meinen persönlichen Geschmack wirkten und wirken die drei Brunnen falsch skaliert und eher wie Spielzeuge als denn echte Schmuckwerke. Aber damit ließ sich arbeiten.

Fotos erweitern klappt gut!

In einem nächsten Schritt sollte Adobe Firefly in der Photoshop 2023 Beta das Bild sinnvoll nach links und rechts hin zum Superpanorama erweitern.

Das Originalfoto zählt 6.000 mal 4.000 Bildpunkte. In der Breite erweiterte ich es auf 10.000 Pixel Breite:

Foto vom Dresdner Zwinger von Daniel Wendorf
Das erweiterte Foto. (Foto: Daniel Wendorf)

Die weißen Seitenanteile markierte ich mit zwei Auswahlrahmen, welche Firefly generativ füllte, ohne dass ich einen Prompt eingab. Adobe verspricht übrigens, dass die KI schlau genug sei, die Bildinhalte so zu erfassen, dass stimmige Ergänzungen in die Komposition Einzug finden.

Es dauerte einige Minuten, bis Firefly drei Ergebnisse ausspuckte. Die sind wortwörtlich fantastisch und machten aus dem Barockensemble Dresdner Zwinger eine Fantasy-Hochburg:

Hier ein Türmchen, da ein Anbau, dort ein abrupter Abbruch des Areals – mit dem echten Zwinger hatte das nichts zu tun, aber es ergänzte das Foto doch um einige interessante Elemente, die eine vollkommen neue Bildkomposition zeigten.

Für Smartphone-Fotografen und damit Verfechter des Hochformatfotos, offenbarte Firefly mir noch eine schöne Möglichkeit, halbwegs glaubhaft offene Landschaften zu erweitern.

Am Beispiel unten erklärt: Dort ist ein Pferd zu sehen, das in die Ferne schaut. Nun ja, sollte es eigentlich, doch das Hochformat engt das Panorama ein.

Foto: Claudia Hesse
Das Pferd starrt – wohin eigentlich? (Foto: Claudia Hesse)

In Adobe Photoshop erweiterte ich das Foto nach links, markierte wieder die leere Fläche und ließ die generative Füllung ohne vorherigen Prompt vornehmen.

Gut, ich hatte mir noch den Jux gemacht einen Vulkan in den Hintergrund und einen Traktor aufs Feld zu stellen. Aber das Gesamtresultat sah doch mindestens passabel aus, sehr wohl aber kam endlich so etwas wie ein Gefühl für diese weite Landschaft auf.

Foto: Claudia Hesse, mit Unterstützung durch Adobe Firefly
Dieses Bild gibt die Weite der Landschaft besser wieder – auch wenn ein Vulkan und der Traktor herbeifantasiert sind. (Foto: Claudia Hesse, mit Unterstützung durch Adobe Firefly)

Ab zum dritten – und vermutlich schwierigsten – Test für die KI.

Porträts ergänzen und ändern

Zugegeben, Porträtfotografie kann ich so überhaupt nicht. Deshalb griff ich hier auf ein Foto von Moe Magners via Pexels zu. Das Original ist eine schöne Aufnahme einer älteren Dame:

(Foto: Moe Magners)
(Foto: Moe Magners)

Die Überlegung vorab: Schwierigkeiten könnten der KI die Drehung der Person und die vielen Falten sein. Kann Firefly hier noch die Frau erkennen? Oder halluziniert sich die KI etwas Anderes? Das Szenario war reizvoll, technisch gesehen.

Ein erster Test war sehr einfach: Ich wollte der Dame eine stylische Sonnenbrille und ein Basecap verpassen. Wieder maskierte ich im Original den Bereich, den ich mit einem Prompt ändern wollte. Ich gab ein: „attractive sunglasses in 80’s style and a basecap in the colors of the rainbow“.

Firefly ergänzte nicht nur die Klamotten, es tauschte den ganzen Kopf aus. Die Ergebnisse waren eher unerwartet, wie ich finde:

Das alte Gesicht ersetzte die Software durch drei junge Frauen, ein Regenbogen-Basecap gab es in keiner Version und statt in die Ferne zu schauen, glotzten die drei KI-Frauen nun aus dem Monitor.

Um der Dame des Originalfotos ihre Würde zurückzugeben und mit Coolness zu pimpen, verpasste ich ihr nach dem Gesichts-Rollback einen Rennanzug, oder im Prompt ausgedruckt: „a race suit in yellow and black showing a pattern of bananas“. Der Ablauf war identisch zu den Versuchen davor: Rahmen ziehen, Text eingeben, klicken – und warten.

Die Ergebnisse waren diesmal okay, wenngleich das Bananen-Muster auf keinem Bild zu finden war:

Hände als großes Problemfeld

Eine längere Betrachtung der KI-generierten Bilder bereitete mir jedoch unbeschreibliches Unwohlsein. Details zeigen, warum. Wie auch Midjourney, Dall-E und Co. hat Firefly insbesondere mit den Händen zu kämpfen.

Schau genau hin - menschlich ist diese Hand nicht. (Eigenes Werk, unterstützt durch Adobe Firefly)
Schau genau hin – menschlich ist diese Hand nicht. (Eigenes Werk, unterstützt durch Adobe Firefly)

Obwohl die Software nur die Klamotte tauschen sollte, änderte Firefly auch die Handposition und -geste. Statt ein natürliches, glaubwürdiges Resultat zu liefern, hätte das Gezeigte auch locker im Horrorfilm für Schockmomente sorgen können.

Warum gerade Hände ein Problem für Bild-KIs sind, zeigt dieses englischsprachige Video sehr gut:

Deine Zustimmung zur Anzeige dieses Inhalts

Um diesen Inhalt von YouTube ansehen zu können, benötigen wir deine einmalige Zustimmung. Bitte beachte dabei unsere Datenschutzbestimmungen und die Datenschutzhinweise von YouTube. Über die Cookie-Einstellungen (Link in der Fußzeile) kannst du die Einwilligung jederzeit widerrufen.

Technische Macken in der Desktop-Version

Ja, Firefly in Adobe Photoshop läuft in einer Beta-Version. Schon klar. Aber Adobe quält mit einigen technischen Details viele Rechner.

Da wäre zu nennen, dass die Anwendung mal eben 50 GB Festplattenspeicher plus (!) unzählige GB als Cache verlangt, damit Firefly vernünftig arbeiten kann. Geht der Speicherplatz aus, reagiert Photoshop zumindest in der vorliegenden Beta-Version mit spontanen Abstürzen oder weigert sich Bildgrößen zu ändern oder Dateien zu exportieren.

Der Ressourcenhunger ist also nicht ohne. Was noch hinzukommt ist, dass der neue Dialog öfter mal den Workflow einbremst. Wenn Firefly einen Bildinhalt komponiert, müssen die weiteren Arbeiten am Foto oder Bild ruhen. Photoshop reagiert schlicht auf keine Maus-Tastatur-Eingabe. Da die Berechnungen teils Minuten dauern, verzögert sich die ansonsten so flotte Bildbearbeitung.

Adobe Express: Browser-Leichtgewicht mit Firefly-KI

Adobes Ziel ist Firefly als KI-Tool in allerlei Anwendungen verfügbar zu machen – was Microsoft mit ChatGPT und Co-Pilot in Office umsetzt, soll Kreativen in allen Firefly-befeuerten Tools ebenfalls den Arbeitsalltag erleichtern.

Mit Adobe Express steht eine weitere Adobe-Anwendung bereit, die mittels Firefly kreative Abkürzungen verspricht. Anders als Photoshop ist Adobe Express nur im Browser verfügbar. Dort unterstützt es Content Creator, die flugs aus Vorlagen kleine Video, Fotobeiträge oder Video-Thumbnails erstellen wollen und das mächtige Photoshop mit all seinen Funktionen scheuen. Zugriff auf den Service hast du nur als zahlender Creative-Cloud-Abonnent.

Adobe Express im Browser
Schon die Oberfläche verrät, dass Adobe Express möglichst hip sein soll. (Mit Material von Adobe)

Derzeit kann Firefly in Adobe Express nur statische Grafiken und Texte komponieren. Du kannst die Resultate aber mit Bewegtbildern, etwa Instagram-Reels, kombinieren.

Wie gut die Bild-Generierung unter Adobe Express funktioniert, wollte ich durch folgenden Prompt wissen: „A Euronics employee with a big smartphone jumping over a pink Ferrari“.

Das Ergebnis ist diese Dame mit Gruselhänden:

Ein von Adobe Firefly generiertes Bild
Dieses Bild zeigt einen Euronics-Mitarbeiter mit großem Smartphone, der/die über einen pinken Ferrari springt. Meint zumindest Adobe Firefly. (Mit Material von Adobe Firefly)

Dämonisches Fußballspiel

Vielleicht war mein Prompt nicht exakt genug? ich erinnerte mich, dass ich zur Fußballeuropameisterschaft 1996 in England einen Nike-Spot sah, in welchem Fußballer gegen Höllenwesen spielten. Joa, etwas Ähnliches könnte doch Firefly mal zaubern.

Also: „Create a photo which shows a human soccer team which is playing soccer against the demons of hell in a dark stadium with outlines in flames“.

Ein von Adobe Firefly kreiertes Foto
Ein menhschliches Fußball-Team, das gegen Höllenwesen kämpft? Das ist Fireflys Interpretation. (Mit Material von Adobe Firefly)

Überzeugend ist das nicht – was ich nach längerer Zeit mal wieder Dall-E bemühte, mit demselben Prompt ein eigenes Bild zu erschaffen:

Dall-E versteht Prompts etwas besser. (Mit Material von Open AI)
Dall-E versteht Prompts etwas besser. (Mit Material von Open AI)

Ich bin wahrlich kein Prompt-Profi, aber Dall-E kam meiner Vorstellung schon ein gutes Stück näher. Nun ja, zum versöhnlichen Abschluss wollte ich einfach eine mittelalterliche Stadt im Sonnenuntergang.

„Create the photo of a medieval city in the sunset“. Das wollt ich mitsamt eines Textes, der wie aus Garn gestrickt aussieht, zum Aufmacherbild kombinieren. Das Resultat hast du bereits eingangs gesehen und ja, so wild zusammengesetzt ist es furchtbar. Dass alle Teile einer Collage zusammenpassen – das kann eine KI nun wirklich nicht abnehmen.

Firefly-Einschränkungen und das Adobe-Plus

Bevor ich zu einem vorläufigen Fazit komme, möchte ich dir die Einschränkungen von Firefly nicht vorenthalten. Wie du vielleicht gemerkt hast, reagiert Adobes Bild-KI nicht auf jeden Prompt so hervorsehbar, wie du es vielleicht von konkurrierenden Generatoren kennst. Eine Schwäche, die Adobe aber mit etwas Zeit in den Griff bekommen könnte.

Daneben kommen Einschränkungen durch die Nutzerrichtlinien. Adobe Firefly verweigert folgende Inhalte:

  • Pornografisches Material oder explizite Nacktheit
  • Hasserfüllte oder äußerst anstößige Inhalte, die eine Gruppe aufgrund ihrer ethnischen Zugehörigkeit, nationalen Herkunft, Religion, einer schweren Krankheit oder Behinderung, des Geschlechts, des Alters oder der sexuellen Orientierung angreifen oder entmenschlichen
  • Grafische Gewalt oder Blut
  • Die Förderung, Verherrlichung oder Androhung von Gewalt
  • Illegale Aktivitäten oder Waren
  • Selbstverletzung oder die Förderung von Selbstverletzung
  • Darstellungen von nackten Minderjährigen oder Minderjährigen in sexueller Weise
  • Förderung von Terrorismus oder gewalttätigem Extremismus
  • Verbreitung irreführender, betrügerischer oder täuschender Inhalte, die zu realem Schaden führen könnten
  • Personenbezogene oder private Informationen anderer (wie vollständiger Name, Privatadresse, Telefonnummer, E-Mail-Adresse, Ausweisdaten oder andere Informationen, die sich auf eine identifizierbare Person beziehen)

Das ist eine ganze Batterie an Limitierungen, die aber meiner Einschätzung nach sinnvoll sind. Dafür bietet Adobe aber auch eine rechtliche Sicherheit, die der Konkurrenz fehlt: Alles, was Firefly ausspuckt, darfst du verwenden. Sogar kommerziell. Weil Adobe ausschließlich mit Medien aus der hauseigenen Plattform Adobe Stock trainiert ist.

Fazit: Adobe Firefly ist zu früh geschlüpft

Meiner Einschätzung nach ist Adobe nach Google das zweite namhafte IT-Unternehmen, das seine KI zu früh auf die Öffentlichkeit losließ. Ich weiß, offiziell ist Firefly noch in der Beta.

Doch die Prompts führen zu überraschend miesen Ergebnissen, vielfach halluziniert die Bild-KI Inhalte, die einfach nicht passen. Sei es, weil Firefly mit der Skalierung kämpft, Körperpartien austauscht oder – wie die Konkurrenz – mit Händen nichts anzufangen weiß.

Das sind grunlegende Fheler einer KI, die alsbald den ganzen Adobe-Kosmos bereichern soll, indem es Kreativschaffenden viel Arbeit abimmt. Das klappt in Adobe Express einigermaßen gut, weil es dort nur um „kleine“ Projekte geht. Unter Photoshop zehrt Firefly an den Ressourcen, ohne sich nahtlos in eine Bearbeitung einzufügen. Wenn die KI werkelt, ruhen alle Photoshop-Arbeiten, was den Workflow häufig ausbremst. Hier braucht Adobe noch eine Lösung, die Profis zufriedenstellt.

An die Qualität von Dall-E, Midjourney oder Stable Diffusion kommt Adobe Firefly nicht heran. Noch nicht. Denn wenn ein Unternehmen visuelle Bildkomposition meistern kann, dann Adobe.

Adobe Firefly steht in der Beta-Version allen zahlenden Creative-Cloud-Nutzern zur Verfügung. Ein Release der finalen Bild-KI ist nicht kommuniziert.

Neue Beiträge abonnieren!

Täglich frisch um 17 Uhr im Postfach

Themenauswahl

Änderungen jederzeit über die Abo-Verwaltung möglich – weitere Themen verfügbar

Jetzt kommentieren!

Schreibe einen Kommentar

*
*
Bitte nimm Kenntnis von unseren Datenschutzhinweisen.