PICTUREDESK.COM/CHROMORANGE/CHRISTIAN OHDE
Digital.Leben
Geheime Trainingsdaten
Wie und womit KI-Modelle trainiert werden
20. Juni 2024, 17:55
Ein KI-Modell lernt über die Welt, indem es mit riesigen Datensätzen trainiert wird. Erst Millionen Bilder von einem Apfel samt der Bildbeschreibung "Apfel" machen es einer bildverarbeitenden KI möglich, einen Apfel zu erkennen. Was in solche Trainings-Datensätze reinkommt, beziehungsweise wie sie überhaupt zusammengestellt werden, ist fast ein noch größeres Betriebsgeheimnis als die Modelle selbst. Denn es gibt nur wenige offen verfügbare, große Trainingsdatensätze, in die man Einblick nehmen kann. Einer der größten ist mit 5,8 Milliarden Text- und Bilddaten LAION 5B.
Der österreichische Programmierer, Investigativjournalist und Pulitzerpreis-Träger Christo Buschek hat ihn sich genauer angesehen, um zu verstehen, mit welchen Daten Laion 5B KI-Modelle ausbildet. Irmi Wutscher hat mit ihm darüber gesprochen.
Service
Die Recherche von Christo Buschek und Jer Thorp zu LAION 5B
Die Website von LAION 5B
Podcast abonnieren