(Πηγή: www.techgear.gr)
Η Google DeepMind σημειώνει σταθερή πρόοδο στον τομέα της Τεχνητής Νοημοσύνης με τακτικές ενημερώσεις των Gemini, Imagen, Veo, Gemma και AlphaFold. Τώρα, η ομάδα εισέρχεται στον κλάδο της Ρομποτικής με δύο νέα μοντέλα που βασίζονται στο Gemini 2.0: τα Gemini Robotics και Gemini Robotics-ER.
Το Gemini Robotics είναι ένα προηγμένο μοντέλο όρασης-γλώσσας-δράσης (VLA) το οποίο βασίζεται στο Gemini 2.0, με την προσθήκη φυσικών ενεργειών ως νέου τρόπου εξόδου για τον έλεγχο των ρομπότ. Η Google ισχυρίζεται ότι αυτό το νέο μοντέλο μπορεί να κατανοήσει καταστάσεις που δεν έχει δει ποτέ πριν κατά την εκπαίδευση.
Σε σύγκριση με άλλα σύγχρονα μοντέλα όρασης-γλώσσας-δράσης, το… Πηγή (Πηγή: www.techgear.gr)