LoRA und Flux: Neue Technologien zur KI-Bilderzeugung
Homestaging.Blog
Veröffentlicht am: 02.03.2023
Lesezeit: 7 Minuten
LoRA und Flux: Neue Technologien zur KI-Bilderzeugung
In der Welt der künstlichen Intelligenz (KI) hat sich in den letzten Jahren vieles getan. Zwei der aufregendsten Entwicklungen sind sicherlich die neuen KI-Modelle LoRA und Flux. Diese Technologien haben das Potenzial, die Bilderzeugung und -bearbeitung grundlegend zu verändern. Doch was genau sind LoRA und Flux? Und wie funktionieren sie?
Was ist LoRA?
LoRA steht für Low-Rank Adaptations. Es handelt sich hierbei um kleinere KI-Modelle, die speziell dafür entwickelt wurden, auf spezialisierte Aufgaben optimiert zu werden. Mit ihrer Hilfe können große Modelle effizient angepasst und verbessert werden, ohne dass dafür enorme Rechenressourcen notwendig sind.

Was ist Flux?
Flux ist ein hochmodernes KI-Modell zur Bilderzeugung, entwickelt von Black Forest Labs. Es kombiniert Transformator- und Diffusionstechniken und kann auf bis zu 12 Milliarden Parameter skaliert werden. Mit dieser hybriden Architektur bietet es eine erstklassige Promptheit, visuelle Qualität, Bilddetails und Ausgabevielfalt.
Die Entwicklung von Flux kann als bedeutender Fortschritt in der KI-generierten Kunst angesehen werden. Black Forest Labs, gegründet von den ursprünglichen Schöpfern der Stable Diffusion-Modelle, hat Flux als eine Weiterentwicklung vorgestellt. Die bekanntesten Vorgängermodelle wie Stable Diffusion XL und Stable Video Diffusion haben bereits die Bild- und Videogenerierung revolutioniert. Black Forest Labs
Wie funktioniert Flux?
Flux basiert auf einem transformatorbetriebenen Strömungsmodell. Die öffentliche Version von FLUX.1 verwendet eine hybride Architektur aus multimodalen und parallelen Diffusionstransformatorblöcken. Diese Architektur verbessert die bisherigen State-of-the-Art-Diffusionsmodelle durch die Einbeziehung von Flow-Matching, einer Methode, die die Generierung hochauflösender Bilder aus Textbeschreibungen ermöglicht.
Zusätzlich zur leistungsstarken Bilderzeugung verbessert Flux die Hardware-Effizienz und die Modellleistung durch rotierende p-Embold-Prädiktoren. Dies ermöglicht eine schnellere und effizientere Bildsynthese. Eine detaillierte Beschreibung dieser Technik findet man im Papier Scaling Rectified Flow Transformers for High-Resolution Image Synthesis das im Juli 2024 auf der ICML in Wien vorgestellt wurde.
- 1
Verbesserte Beschriftungen
OpenAI hat gezeigt, dass synthetisch erzeugte Bildunterschriften die Leistung von Text-Bild-Modellen deutlich verbessern können.
- 2
Neue Modellarchitektur
Ein neuartiges Diffusions-Backbone auf Basis multimodaler Transformer, genannt MM-DiT, verbessert die Leistung gegenüber bisherigen Modellen.
- 3
Effizientes Training
Das Team von Black Forest Labs hat ein innovatives Zeitschritt-Sampling für das Training rektifizierter Flüsse vorgeschlagen.
Zusammenfassend lässt sich sagen:
Die Technologien LoRA und Flux bieten enorme Fortschritte in der KI-Bilderzeugung. Während LoRA eine effizientere Adaptation und Anpassung ermöglicht, hebt Flux die Bilderzeugung durch seine hybride Architektur und neuartigen Techniken auf ein neues Niveau. Diese Modelle demonstrieren eindrucksvoll, wie weit die Entwicklung in der KI-gestützten Kunst bereits fortgeschritten ist. HomestagingKi

Franziska Staging
Franziska Staging ist Immobilienmarklerin, welche sich insbesondere auf das Thema Homestaging spezialisiert hat. Neben Ihrer Selbständigkeit arbeit Sie bei unserem Team als Autorin - Dort schreibt Sie über aktuelle Trends und neue Technologien.