Eines der nervigsten Probleme bei KI-Bildgeneratoren war schon immer die fehlende Konsistenz von Gesichtern. Man möchte dieselbe Person in verschiedenen Szenen sehen – und plötzlich hat sie eine andere Nase oder ein völlig neues Lächeln.
Google greift dieses Problem jetzt direkt an: Im Gemini-App wurde ein neuer Bildeditor aus dem DeepMind-Team integriert, mit dem kuriosen Namen nano banana.
Das Herzstück ist die Erhaltung der Wiedererkennbarkeit. Ob Selfie, Foto eines Freundes oder sogar des Haustiers – mit Gemini lassen sich extreme Veränderungen durchführen, ohne dass das Gesicht verfälscht wird. Lust auf eine 60er-Jahre-Turmfrisur oder den Chihuahua im Tutu? Das Ergebnis bleibt trotzdem eindeutig wiedererkennbar.
Die Funktionen gehen deutlich weiter: Mehrstufiges Bearbeiten ermöglicht, dass man Bild für Bild aufbaut – erst die Wände neu streichen, dann ein Regal hinzufügen, später den Raum ausleuchten. Außerdem lassen sich Motive nahtlos kombinieren, zum Beispiel sich selbst neben den Hund auf ein Basketballfeld stellen. Auch Musterübertragungen sind drin – ein Kleid mit Schmetterlingsflügeln als Stoffmuster wirkt plötzlich täuschend echt.
Alle erzeugten Bilder werden mit einem Wasserzeichen versehen, damit klar ist: Hier war KI am Werk. Damit rückt Gemini aber vom Spielzeug-Image ab und wird zu einem praktischen Kreativtool für den Alltag. Sollte die Technik halten, was Google verspricht, könnte Gemini der erste große KI-Fotoeditor werden, der Gesichter wirklich konsistent darstellt – und so die Konkurrenz hinter sich lassen.
Das Update wird ab sofort in der Gemini-App ausgerollt und nach und nach für Nutzer weltweit verfügbar sein.
Und noch ein Ausblick: Im Herbst erscheint das Bildband Iconic Phones: Revolution at Your Fingertips, eine nostalgische Reise durch die Kult-Handys des 21. Jahrhunderts – ein Muss für jeden Technikfan.