Apple präsentiert zwei Forschungspapiere zu neuartigen KI-Modellen für Bildgenerierung mit Transformers und Normalizing Flows
- TarFlow-Modell generiert Bilder direkt in Pixelwerten ohne Tokenisierung
- Verwendet Transformer-Blöcke statt traditioneller Schichten für Bildgenerierung
- STARFlow erweitert Ansatz durch Arbeit im komprimierten Latent-Raum
- Ermöglicht hochauflösende Bildgenerierung mit weniger Rechenaufwand
- Kann externe Sprachmodelle wie Gemma für Textprompts integrieren
- Unterscheidet sich von OpenAI-Ansatz durch geringere Komplexität und Ressourceneffizienz
Quelle: 9to5Mac
Hinweis: Dieser Artikel wurde mithilfe von KI erstellt.