Künstliche Intelligenz, Grafik

PICTUREDESK.COM/CHROMORANGE/CHRISTIAN OHDE

Digital.Leben

Geheime Trainingsdaten

Wie und womit KI-Modelle trainiert werden

Ein KI-Modell lernt über die Welt, indem es mit riesigen Datensätzen trainiert wird. Erst Millionen Bilder von einem Apfel samt der Bildbeschreibung "Apfel" machen es einer bildverarbeitenden KI möglich, einen Apfel zu erkennen. Was in solche Trainings-Datensätze reinkommt, beziehungsweise wie sie überhaupt zusammengestellt werden, ist fast ein noch größeres Betriebsgeheimnis als die Modelle selbst. Denn es gibt nur wenige offen verfügbare, große Trainingsdatensätze, in die man Einblick nehmen kann. Einer der größten ist mit 5,8 Milliarden Text- und Bilddaten LAION 5B.

Der österreichische Programmierer, Investigativjournalist und Pulitzerpreis-Träger Christo Buschek hat ihn sich genauer angesehen, um zu verstehen, mit welchen Daten Laion 5B KI-Modelle ausbildet. Irmi Wutscher hat mit ihm darüber gesprochen.

Service

Die Recherche von Christo Buschek und Jer Thorp zu LAION 5B
Die Website von LAION 5B

Podcast abonnieren

Sendereihe