OpenAi bringt die Sora-App auf den Markt, erobert damit die Social-Media-Landschaft von TikTok und fordert YouTube heraus.

OpenAI hat Sora 2 vorgestellt, ein KI-Modell, das Videos aus Textanweisungen generiert, sowie eine dedizierte iOS-App. Dies ist nicht nur ein technisches Upgrade gegenüber dem ersten Sora, sondern ein Strategiewechsel. Sam Altmans Unternehmen betritt direkt den Social-Video-Bereich, denselben Bereich, in dem TikTok, YouTube und Instagram aktiv sind. Der Unterschied besteht darin, dass Inhalte nicht von Nutzern hochgeladen, sondern innerhalb der App generiert werden. Echte Videos oder Fotos können nicht hochgeladen werden, um Deepfakes einzuschränken.
Das Modell verspricht mehr Realismus. Weniger physikalische Fehler, mehr Konsistenz in den Bewegungen und synchronisierten Ton. OpenAI spricht von einer größeren Bandbreite an Stilen, von fotorealistisch bis animiert. Jedes Video wird mit einem Wasserzeichen versehen und Metadaten werden ausgeblendet. Geplant ist außerdem ein „Cameo“-System: Nutzer können entscheiden, wer ihr Gesicht oder ihre Stimme in Videos verwenden darf, und ihre Einwilligung jederzeit widerrufen.
Technisch funktioniert Sora 2 wie ein großes multimodales Transformationsmodell: Es verarbeitet einen Text oder eine visuelle Aufforderung und übersetzt diese in eine Bildfolge mit stimmigem Ton. Es erstellt keine statischen Videos Bild für Bild, sondern generiert sie, als würde es eine fortlaufende Szene mit Schauspielern, Objekten und Bewegungen simulieren. Darin unterscheidet es sich von Sora 1, das oft Schwierigkeiten hatte, die zeitliche Kohärenz aufrechtzuerhalten: Ein Glas könnte zwischen den Bildern seine Form verändern, eine Figur könnte plötzlich verschwinden, Bewegungen könnten einer unphysikalischen Logik folgen.
Mit Sora 2 wollte OpenAI die Gesetze der Welt besser modellieren. Das System lernt anhand großer Datenmengen, nicht nur die visuelle Erscheinung, sondern auch die Dynamik von Ereignissen nachzuahmen. Läuft beispielsweise ein Hund auf Wasser zu, versucht das Modell, den Aufprall auf die Oberfläche und die entstehenden Wellen glaubwürdig darzustellen. Neu ist auch das Audiomanagement: kein künstlicher Soundtrack mehr, sondern Lippensynchronisation und szenenbezogene Hintergrundgeräusche.
Der eigentliche Unterschied liegt jedoch in der App. Die erste Sora war ein Tool für alle, die ohne sozialen Kontext mit generativer KI experimentieren wollten. Sora 2 wird zu einem Ökosystem, in dem Videos direkt in einem Feed erstellt, geteilt und bearbeitet werden. OpenAI möchte über die Bereitstellung der Technologie hinausgehen und eine Plattform schaffen, auf der Technologie zu einem kulturellen Produkt wird.
ilsole24ore