Revolution der künstlichen Intelligenz: Genie 3 kann virtuelle Welten erschaffen

Genie 3 , das sich noch in der Forschungsphase befindet und noch nicht öffentlich verfügbar ist, kombiniert die Fähigkeiten seines Vorgängers Genie 2 und seines Videoproduktionsmodells Veo 3. Das neue KI- Modell kann minutenlange interaktive 3D-Umgebungen mit 24 Bildern pro Sekunde und einer Auflösung von 720p erstellen. Dies ist ein deutlicher Fortschritt gegenüber den 10- bis 20-sekündigen Szenen, die Genie 2 produzieren konnte.
Das Beeindruckendste an dem Modell ist seine Fähigkeit, zuvor von Genie 3 generierte Bilder abzurufen und darauf basierend logisch zu entscheiden, wie sich Ereignisse entwickeln. Das Unternehmen betont, dass diese Konsistenz nicht künstlich kodiert ist; das Modell lerne von selbst. „Wir haben dieses Modell nicht darauf trainiert, die reale Welt nachzuahmen und Entscheidungen nach den Gesetzen der Physik zu treffen“, sagt DeepMind -Forscher Shlomi Fruchter. „Es hat diese Konsistenz von selbst gelernt.“
Genie 3 kann Szenen basierend auf Benutzerbefehlen ändern. Wenn beispielsweise einer KI-Figur mitten in einer Lagerhalle der Befehl „Geh zur grünen Müllpresse“ oder „Geh auf den roten Gabelstapler zu“ gegeben wird, erstellt Genie 3 die Umgebung und die Figur führt in dieser Welt Aktionen aus. Laut DeepMind-Tests wurden diese Aufgaben erfolgreich abgeschlossen.
Genie 3 hat jedoch seine Grenzen. So wurde beispielsweise beobachtet, dass der Schnee in einer Szene, in der ein Skifahrer einen Berg hinunterrutschte, nicht realistisch reagierte. Darüber hinaus ist das Modell immer noch nicht in der Lage, die komplexen Interaktionen mehrerer unabhängiger Charaktere zu simulieren, und auf wenige Minuten begrenzte Simulationen reichen für stundenlanges Training nicht aus.
Dennoch sagen Experten, dass diese Technologie die KI einen Schritt näher an die Nachahmung menschenspezifischer Verhaltensweisen bringt, wie etwa Planung, Erkundung der Umgebung, Navigation im Unbekannten und Verbesserung durch Erfahrung.
milliyet