Studie von Apple und Ohio State University stellt FS-DFM-Modell vor, das mit nur acht Iterationen qualitativ hochwertige Langtexte generiert
- Forscher von Apple und Ohio State University entwickelten Few-Step Discrete Flow-Matching (FS-DFM) Modell
- Das Modell soll bis zu 128-mal schneller als vergleichbare Diffusion-Modelle arbeiten
- FS-DFM erreicht mit nur acht Verfeinerungsdurchläufen vergleichbare Qualität wie Modelle mit über tausend Iterationen
- Dreistufiger Ansatz: Training für verschiedene Iterationsbudgets, „Lehrer“-Modell zur Optimierung und verbesserte Iterationsprozesse
- Das Modell übertrifft größere Diffusion-Modelle in den Metriken Perplexität und Entropie
- Code und Model-Checkpoints sollen laut Forschern veröffentlicht werden, um Reproduzierbarkeit zu ermöglichen
Quelle: 9to5Mac
Hinweis: Dieser Artikel wurde mithilfe von KI erstellt.

