Share

Related

3 Monaten her
Der Hype um KI führt in den USA zu eskalierenden IT-Gehältern und einem harten Konkurrenzkampf um qualifizierte Fachkräfte.
2 Monaten her
KI-Modell des MIT identifiziert effektiv verschiedene Stadien von Brustkrebs, um Überbehandlungen zu minimieren.
3 Monaten her
Baidu baut mit neuen KI-Chatbot-Versionen sein Dienstleistungsangebot aus und steigert die Qianfan-Plattformauslastung.
1 Monat her

Einführung des Stable Video 4D: Innovation in dynamischer Multi-Winkel Videogenerierung

Das Stable Video 4D-Modell, neueste Entwicklung von Stability AI, ermöglicht die Erstellung von Videos aus verschiedenen Perspektiven, indem es einzelne Videos in dynamische, mehrwinklige 3D-Videos umwandelt. Nutzer können spezifische 3D-Kamerapositionen angeben, woraufhin das Modell acht neue Ansichtsvideos generiert.

Jede dieser Ansichten besteht aus fünf Frames und wird in etwa 40 Sekunden erstellt, während die gesamte 4D-Optimierung circa 20 bis 25 Minuten dauert. Diese Technologie steht auf Hugging Face zur Verfügung und verspricht, insbesondere in Berufsfeldern wie Spielentwicklung, Videobearbeitung und VR, nützlich zu sein.

Im Vergleich zu früheren Methoden, die häufig auf einer Kombination aus Bild- und Videodiffusionsmodellen basierten, bietet Stable Video 4D eine effizientere und konsistente Erstellung von Multi-Winkel-Videos. Die integrierte 4D-Optimierungsframework ist weniger aufwendig und ermöglicht eine detailliertere und originalgetreuere Videoausgabe.

Begleitend zur Markteinführung wurde ein umfassender technischer Bericht veröffentlicht, der Methodologien, Herausforderungen und Durchbrüche bei der Entwicklung des Modells andeutet. Stability AI setzt auf kontinuierliche Forschung und Entwicklung, um das Potenzial dieser Technologie weiterhin zu erweitern und zu verbessern.

Lesenswert hierzu

Dieser Artikel wurde vollständig oder teilweise durch eine Künstliche Intelligenz (KI) erstellt. Obwohl wir bemüht sind, genaue und aktuelle Informationen bereitzustellen, können wir keine Garantie für die Richtigkeit oder Vollständigkeit des Inhalts übernehmen. Bitte überprüfen Sie alle Informationen und ziehen Sie bei Bedarf eine fachkundige Beratung hinzu.

Weitere News

14 Stunden her
Moshi von Kyutai, ein KI-Sprachassistent, bietet Echtzeit-Reaktionen und emotionales Verständnis.
1 Woche her
Mistral Large 2, verfügbar in IBM watsonx™, bietet fortschrittliche Funktionen in Codegenerierung und multilingualer Unterstützung.

Kategorien

Allgemein

Automatisierung

Digitalisierung

Forschung & Entwicklung

Generative KI

KI in der Praxis

KI in Marketing

KI-Anwendungen

KI-Ethik

KI-News & Trends

Produktivität

Robotik

Teilen Sie es mit der Welt!