
Digital.Leben
KI-Roboter
Wie erweiterte Sprachmodelle auf Zuruf Automaten steuern
27. März 2025, 17:55
Zwei Roboterarme falten aus Papier einen Fuchs - und das auf Zuruf. Das ist nur eines von mehreren Videos, die Google letzte Woche präsentiert hat, um Gemini Robotics vorzustellen. Das KI-Sprachmodell Gemini hat ja auch Bilderkennung integriert, es kann also der sichtbaren Welt Wörter und Bedeutung zuordnen. Gemini Robotics geht darüber hinaus, weil es nicht nur Bilder benennen oder Texte zusammenfassen kann. Es erkennt Objekte und kann Roboter über sprachliche Befehle steuern, da es einige logische Zusammenhänge begreift, die man zum Beispiel zur Orientierung im Raum braucht.
Physical AI - also physische künstliche Intelligenz nennt sich dieser Zweig in der Forschung. Mehr dazu von Franz Zeller.