Share
Related
Urheberrechtsfragen in der KI-Entwicklung
Automatisierung und KI im Arbeitsmarkt: Chancen und Herausforderungen
Perplexity: Ein neues Startup im Bereich KI-gestützte Websuche
Die Herausforderung für die Klimaziele durch den Energiebedarf der KI
Einführung der Solos AirGo Vision: Eine erschwingliche AR-Brille mit GPT-4o-Unterstützung
Realistische Einschätzungen zur künstlichen Intelligenz von Google-Forscher François Chollet

Googles Lumiere: Eine neue Ära der generativen KI für realistische Videos

Google-Forscher haben mit Lumiere ein innovatives Text-zu-Video (T2V)-Diffusionsmodell entwickelt. Diese Technologie ermöglicht es, aus Textbeschreibungen realistische Videos zu erzeugen und übertrifft damit Alternative Modelle.

Dank der neuen Space-Time U-Net (STUNet)-Architektur kann das Modell Videos mit zusammenhängenden Bewegungen in hoher Qualität produzieren. Außerdem ist es für eine Vielzahl von Anwendungen einsetzbar, wie Video-Inpainting oder Bild-zu-Video-Generierung. Lumiere basiert auf einem präexistenten Text-zu-Bild-Modell und wurde um Aspekte der zeitlichen Dimension erweitert.

Das Down-Sampling und Up-Sampling im räumlichen und zeitlichen Bereich ermöglicht effizientere Prozesse bei der Videoerstellung. Im Vergleich zu früheren Methoden werden Bewegungen über das gesamte Video realistischer und kohärenter wiedergegeben. Eine Besonderheit ist, dass das Video als Ganzes und nicht nur in einzelnen Segmenten generiert wird.

Obwohl Lumiere in einer Benutzerstudie andere Modelle übertroffen hat, ist auch dieser Ansatz noch nicht perfekt ausgereift. So bleiben Herausforderungen bestehen, beispielsweise die Generierung von Videos mit mehreren Szenen. Diese stellen weiterhin ein Forschungsfeld dar.

Lesenswert hierzu

Die Themen dieser Artikel wurden von einer KI bezüglich ihrer Relevanz bewertet, aus mehreren Quellen zusammengetragen, zusammengefasst und von einem Menschen redigiert.

Weitere News

Allgemein

Automatisierung

KI-News & Trends

Tauchen Sie ein in die Welt der KI-Stimmen: Erstellen Sie realistische Stimmen, und entdecken Sie Top Text-to-Speech-Tools. Perfekt für Sprachsynthese-Enthusiasten.
Entfesseln Sie Storytelling mit Midjourney: Lernen Sie, Storyboards durch KI-Prompting zu perfektionieren. Erwecken Sie Ihre Erzählungen zum Leben.
Meistern Sie die Erstellung filmischer Bilder mit Midjourney. Unser Tutorial zeigt, wie Sie Prompts für atemberaubende visuelle Geschichten nutzen.

Kategorien

Allgemein

Automatisierung

Digitalisierung

Forschung & Entwicklung

KI in der Praxis

KI in Marketing

KI Videos

KI-Anwendungen

KI-Audio

KI-Bilder

KI-Ethik

KI-News & Trends

KI-Text

Produktivität

Teilen Sie es mit der Welt!