Share

Related

10 Monaten her
KI-Fingerabdruck-Technologie analysiert die Medikamentenreaktion von Krebszellen.
8 Monaten her
Westpac entwickelt KI zur Echtzeit-Betrugserkennung und stärkt Kundenservice.
10 Monaten her
Der Xbox Copilot bietet personalisierte KI-Unterstützung für Gamer, die in Echtzeit hilft.
3 Wochen her

FLUX.2 von Black Forest Labs: Produktionsorientierte Bildmodelle mit offenem VAE

Black Forest Labs (BFL) hat FLUX.2 vorgestellt, ein System für Bildgenerierung und -bearbeitung, das auf verlässliche Produktions-Workflows zielt. Kernelement ist ein offen verfügbares VAE unter Apache 2.0, das die gemeinsame latente Repräsentation für alle FLUX.2-Varianten bereitstellt. Ziel sind bessere Interoperabilität, Auditierbarkeit und geringere Abhängigkeit von einzelnen Anbietern.

FLUX.2 erweitert FLUX.1 um Multi-Reference-Conditioning (bis zu 10 Bilder), höhere Auflösung inklusive 4‑MP‑Editing sowie deutlich stabilere Typografie. Technisch setzt die Reihe auf latent flow matching mit einem rectified-flow-Transformer und einem auf Mistral‑3 (24B) basierenden Vision‑Language‑Modul. Das verbessert semantische Zuordnung, Szenenkohärenz und Prompt-Befolgung.

Zum Start gibt es fünf Bausteine: FLUX.2 [Pro] (gehostet, höchste Qualität und niedrige Latenz), FLUX.2 [Flex] (fein justierbare Sampling‑Schritte/Guidance), FLUX.2 [Dev] (32B Open‑Weights für lokale Nutzung, kommerzielle Lizenz nötig), FLUX.2 [Klein] (angekündigt, Apache 2.0) sowie das offene FLUX.2‑VAE. Hosting ist u.a. über FAL, Replicate, TogetherAI, Cloudflare und weitere Partner verfügbar.

Interne Benchmarks berichten für [Dev] höhere Win‑Rates gegenüber offenen Alternativen bei Text‑zu‑Bild, Einzel‑ und Multi‑Referenz‑Editing; ELO‑Scores der Varianten liegen grob im Bereich 1030–1050 bei moderaten Kosten. In Preisvergleichen zeigt der BFL‑Kalkulator rund 0,03 US‑$ je Megapixel für [Pro], während Gemini 3 Pro (Nano Banana Pro) effektiv deutlich höher pro Bild liegt; Details hängen von Auflösung und Workflow ab.

Für Unternehmen sind vor allem die standardisierte latente Ebene und die offenen Gewichte relevant: Sie erleichtern Self‑Hosting, CI/CD‑Integration, Governance und spätere Modellwechsel ohne Umbauten nachgelagerter Tools. Anwendungsfelder reichen von markenkonformen Assets und Produktvisualisierung bis zu Dokumentation und UI‑Layouts; der Fokus liegt auf planbarer Qualität, Kostenkontrolle und integrierbarer Orchestrierung.

Lesenswert hierzu

Dieser Artikel wurde vollständig oder teilweise durch eine Künstliche Intelligenz (KI) erstellt. Obwohl wir bemüht sind, genaue und aktuelle Informationen bereitzustellen, können wir keine Garantie für die Richtigkeit oder Vollständigkeit des Inhalts übernehmen. Bitte überprüfen Sie alle Informationen und ziehen Sie bei Bedarf eine fachkundige Beratung hinzu.

Weitere News

3 Tagen her
DT-GPT nutzt elektronische Gesundheitsakten, um digitale Patientenzwillinge zu erstellen und individuelle Gesundheitsverläufe präziser vorherzusagen.
3 Tagen her
Microsoft 365 führt zwei neue KI-Agents ein: Researcher und Analyst für verbesserte Effizienz.

Kategorien

Allgemein

Automatisierung

Digitalisierung

Forschung & Entwicklung

Generative KI

KI in der Praxis

KI in Marketing

KI-Anwendungen

KI-Ethik

KI-News & Trends

Produktivität

Robotik

Teilen Sie es mit der Welt!