
OpenAI hat Sora 2 vorgestellt – die neue Generation seines Video- und Audiomodells, das schon jetzt als der größte Sprung seit der Einführung von Sora gilt. Laut dem Unternehmen markiert Sora 2 einen Meilenstein, vergleichbar mit dem Wechsel von GPT-3 zu GPT-3.5: nicht nur ein Update, sondern eine echte Weiterentwicklung mit deutlich mehr Realismus, physikalischer Genauigkeit und erweiterten Kontrollmöglichkeiten für Nutzer.
Sora 2 erzeugt Videos, die physikalisch konsistent und über mehrere Szenen hinweg stimmig bleiben. Verwaschene Objekte oder unlogische Bewegungen, wie sie ältere Modelle oft zeigten, gehören der Vergangenheit an. Ob realistische Filmoptik, hyperrealistische Darstellungen oder Anime-Stil – die neue Version deckt ein breites Spektrum ab. Dazu kommen verbesserte Editing-Tools, mit denen Anwender Szenen gezielt anpassen können. Besonders stark überarbeitet wurde auch die Audio-Engine: Dialoge, Soundeffekte und Umgebungsgeräusche laufen nun synchron mit dem Bild und steigern so die Glaubwürdigkeit der Clips erheblich.
Zum Start gibt es eine exklusive iOS-App, die nur per Einladung genutzt werden kann. Außerdem wurden neue Sicherheitsregeln eingeführt: Videos mit Prominenten oder öffentlichen Personen dürfen ohne deren Zustimmung nicht erstellt werden. Nutzer können allerdings eine Freigabe für ihr eigenes Abbild erteilen – und diese jederzeit wieder zurückziehen. Der Rollout beginnt in den USA und Kanada, zunächst mit kostenlosem Zugang und großzügigen Limits. Für ChatGPT-Pro-Abonnenten gibt es die Sora-2-Pro-Version mit noch höherer Qualität, und auch eine API wurde bereits angekündigt.
Einige Beispiele, wie das extrem realistisch wirkende Rückwärtssalto-Video, haben gezeigt, wie täuschend echt die Ergebnisse sind. Doch neben der Begeisterung wächst auch die Skepsis. Viele befürchten, dass bald ein Großteil des Online-Contents von KI stammt und echte von künstlichen Inhalten kaum noch unterscheidbar sein werden. Fachleute weisen zudem auf die enorme Rechenleistung hin, die für Sora 2 notwendig ist – mit einem Bedarf an GPUs und Prozessoren, der sogar den Energiehunger des Krypto-Minings übertreffen könnte. Kritiker sehen darin ein Zeichen dafür, dass die Entwicklung an die Grenzen des Sinnvollen stößt und erhebliche gesellschaftliche wie technologische Risiken mit sich bringt.