Share

Related

2 Jahren her
Der Hype um KI führt in den USA zu eskalierenden IT-Gehältern und einem harten Konkurrenzkampf um qualifizierte Fachkräfte.
11 Monaten her
IKEA USA verwendet AI-Drohnen zur Inventurerfassung und Effizienzsteigerung.
11 Monaten her
Vodafone investiert in KI von Microsoft und OpenAI für effizienteren Kundenservice.
2 Jahren her

Googles Lumiere: Eine neue Ära der generativen KI für realistische Videos

Google-Forscher haben mit Lumiere ein innovatives Text-zu-Video (T2V)-Diffusionsmodell entwickelt. Diese Technologie ermöglicht es, aus Textbeschreibungen realistische Videos zu erzeugen und übertrifft damit Alternative Modelle.

Dank der neuen Space-Time U-Net (STUNet)-Architektur kann das Modell Videos mit zusammenhängenden Bewegungen in hoher Qualität produzieren. Außerdem ist es für eine Vielzahl von Anwendungen einsetzbar, wie Video-Inpainting oder Bild-zu-Video-Generierung. Lumiere basiert auf einem präexistenten Text-zu-Bild-Modell und wurde um Aspekte der zeitlichen Dimension erweitert.

Das Down-Sampling und Up-Sampling im räumlichen und zeitlichen Bereich ermöglicht effizientere Prozesse bei der Videoerstellung. Im Vergleich zu früheren Methoden werden Bewegungen über das gesamte Video realistischer und kohärenter wiedergegeben. Eine Besonderheit ist, dass das Video als Ganzes und nicht nur in einzelnen Segmenten generiert wird.

Obwohl Lumiere in einer Benutzerstudie andere Modelle übertroffen hat, ist auch dieser Ansatz noch nicht perfekt ausgereift. So bleiben Herausforderungen bestehen, beispielsweise die Generierung von Videos mit mehreren Szenen. Diese stellen weiterhin ein Forschungsfeld dar.

Lesenswert hierzu

Dieser Artikel wurde vollständig oder teilweise durch eine Künstliche Intelligenz (KI) erstellt. Obwohl wir bemüht sind, genaue und aktuelle Informationen bereitzustellen, können wir keine Garantie für die Richtigkeit oder Vollständigkeit des Inhalts übernehmen. Bitte überprüfen Sie alle Informationen und ziehen Sie bei Bedarf eine fachkundige Beratung hinzu.

Weitere News

11 Stunden her
Fujitsu und NVIDIA bauen eine Full‑Stack‑KI‑Plattform mit KI‑Agenten und eng gekoppelter CPU‑GPU‑Infrastruktur für Industrieanwendungen auf.
1 Tag her
NVIDIA erweitert sein Open-Source-KI-Angebot mit Modellen, Datensätzen und Tools für Sprache, Robotik und Biomedizin, zugänglich über Hugging Face und als NIM-Microservices.

Kategorien

Allgemein

Automatisierung

Digitalisierung

Forschung & Entwicklung

Generative KI

KI in der Praxis

KI in Marketing

KI-Anwendungen

KI-Ethik

KI-News & Trends

Produktivität

Robotik

Teilen Sie es mit der Welt!