Google TurboQuant: Ο αλγόριθμος που μειώνει τις απαιτήσεις μνήμης AI κατά 6x

(Πηγή: www.techgear.gr)

Σύνοψη

Ο αλγόριθμος TurboQuant: Η Google DeepMind παρουσίασε μια νέα τεχνολογία συμπίεσης που μειώνει τον όγκο μνήμης (VRAM) που απαιτείται για την εκτέλεση μοντέλων τεχνητής νοημοσύνης κατά έξι φορές (6x). Συμπίεση χωρίς απώλειες: Στοχεύει αποκλειστικά στην προσωρινή μνήμη Key-Value (KV cache), μειώνοντας τα δεδομένα από τα 16 bits στα 3 bits ανά τιμή, διατηρώντας το 100% της ακρίβειας και αυξάνοντας την ταχύτητα συμπεράσματος (inference) έως και 8x σε κάρτες Nvidia H100. Κατάρρευση μετοχών: Η ανακοίνωση προκάλεσε πτώση 5% έως 7% στις μετοχές των κολοσσών κατασκευής μνήμης (Samsung, SK Hynix, Micron, Kioxia), καθώς οι επενδυτές φοβήθηκαν μείωση της ζήτησης για hardware. Η… Πηγή

Google TurboQuant: Ο αλγόριθμος που μειώνει τις απαιτήσεις μνήμης AI κατά 6x

(Πηγή: www.techgear.gr)

Αφήστε μια απάντηση Ακύρωση απάντησης