Apple veröffentlicht kostenlosen KI-Datensatz mit 400.000 Bildern
Apple öffnet sich in einem bisher seltenen Schritt gegenüber der KI-Forschung: Das Unternehmen hat den Datensatz „Pico-Banana-400K“ mit mehr als 400.000 KI-bearbeiteten Bildern veröffentlicht. Die Sammlung ist kostenlos auf GitHub verfügbar und soll Forscher:innen helfen, neue Modelle zur Bildbearbeitung und visuellen Generierung zu entwickeln. Besonders bemerkenswert – für die Erstellung des Datensatzes nutzte Apple ausgerechnet Googles eigene KI-Systeme.
Die Apple-Forscher:innen kombinierten mehrere externe Modelle, um den Datensatz zu erzeugen. Ausgangspunkt waren Bilder der Plattform Open Images, die Szenen mit Menschen, Objekten und Text zeigen. Anschließend entwickelten die Forscher:innen 35 verschiedene Prompts über Gemini 2.5 Flash, um typische Aufgaben für KI-Bildmodelle zu simulieren – etwa das Hinzufügen von Filtern, Änderungen von Gesichtsausdrücken oder Stilübertragungen im Stil bekannter Künstler.
Zur Umsetzung dieser Anweisungen nutzte Apple Nano Banana, ein Bildbearbeitungsmodell, das die Prompts visuell umsetzte. Danach prüfte Gemini 2.5 Pro, ob die erstellten Bilder den Anweisungen tatsächlich entsprachen. Das Ergebnis: ein detaillierter Datensatz mit 257.000 erfolgreichen Bearbeitungen, 72.000 Mehrfach-Prompt-Fällen und 56.000 Fehlschlägen, die allesamt dokumentiert wurden.
KI WEEKLY
Wöchentliches KI-Wissen kompakt und verständlich — jeden Sonntag in deinem Postfach. Schließe dich 2500+ Abonnenten an!
Jeden Sonntag neu!
Wir respektieren deine Privatsphäre. Abmeldung jederzeit möglich.
Die Kombination aus erfolgreichen und gescheiterten Beispielen soll künftigen Modellen ermöglichen, nicht nur aus gelungenen Ergebnissen, sondern auch aus Fehlern zu lernen. In ihrem begleitenden Paper beschreiben die Apple-Forscher:innen das Projekt als „skalierbares Framework für hochwertige KI-Bildbearbeitung“. Der Datensatz fällt unter die Non-Commercial Research License – das bedeutet, er darf frei für Forschungszwecke genutzt werden, nicht aber für kommerzielle Produkte.
Mit „Pico-Banana-400K“ liefert Apple nicht nur eines der größten öffentlich zugänglichen Bildsets seiner Art, sondern sendet auch ein Signal in Richtung offenerer KI-Forschung. Der Einsatz von Googles Gemini-Modellen für die Qualitätskontrolle zeigt zudem, dass selbst unter Tech-Giganten Interoperabilität und Experimentierfreude zunehmend wichtiger werden – ein bemerkenswerter Schritt in einer Branche, die sonst vor allem durch Konkurrenz geprägt ist.

