Google Gemini 3.1 Flash Live: Η νέα εποχή της φωνητικής AI

(Πηγή: www.techgear.gr)

Σύνοψη

Η Google ανακοίνωσε το Gemini 3.1 Flash Live, το πιο προηγμένο μοντέλο ήχου για διάλογο σε πραγματικό χρόνο, το οποίο ελαχιστοποιεί την καθυστέρηση (latency) στις απαντήσεις. Το νέο μοντέλο διαθέτει βελτιωμένη ικανότητα απομόνωσης του θορύβου υποβάθρου και αντιλαμβάνεται πλήρως ακουστικές αποχρώσεις, όπως ο τόνος και ο ρυθμός της ομιλίας. Το API είναι ήδη διαθέσιμο στο Google AI Studio, ενώ η τεχνολογία τροφοδοτεί ταυτόχρονα το Gemini Live και το Search Live παγκοσμίως, εξάγοντας αποκλειστικά ήχο με υδατογράφημα SynthID για λόγους ασφαλείας. Παράλληλα, το Live Translate μέσω ακουστικών γίνεται επίσημα διαθέσιμο στο οικοσύστημα του iOS (εκτός από το Android), παρέχοντας μετάφραση σε… Πηγή

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *