Apple-Forscher veröffentlichen 400.000-Bild-Datensatz zur Verbesserung von KI-Bildeditoren und kritisieren bestehende Trainingsdaten als unzureichend
- Apple-Forscher haben Forschungsarbeit „Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing“ veröffentlicht
- Kritik an aktuellen KI-Bildbearbeitungssystemen: Fehlen großer, hochwertiger und öffentlich zugänglicher Datensätze mit echten Bildern
- Neuer Datensatz umfasst 400.000 Bilder für instruktionsbasierte Bildbearbeitung
- Bilder wurden systematisch nach Qualität und Vielfalt ausgewählt und sind für nicht-kommerzielle Nutzung frei verfügbar
- Datensatz enthält 35 verschiedene Bearbeitungstypen wie Objektverschiebung, künstlerische Effekte und Zoom-Funktionen
- Apple nutzte Gemini-2.5-Pro zur Qualitätskontrolle und Akzeptanzbewertung der generierten Bilder
- Datensatz beinhaltet Einzel- und Mehrfachbearbeitungen sowie Vergleichspaare von erfolgreichen und fehlgeschlagenen Ergebnissen
- Apple betont Bedeutung des Datensatzes als robuste Grundlage für Training zukünftiger KI-Bildeditoren
Quelle: AppleInsider
Hinweis: Dieser Artikel wurde mithilfe von KI erstellt.

