Επιστήμονες ανέπτυξαν μια θεμελιώδη αρχιτεκτονική για την επόμενη γενιά οπτικής πληροφορικής χρησιμοποιώντας φως αντί για ηλεκτρισμό για την τροφοδότηση των τσιπ κάτι που θα μπορούσε να φέρει επανάσταση στον τρόπο με τον οποίο εκπαιδεύονται και λειτουργούν τα μοντέλα τεχνητής νοημοσύνης όπως τα μεγάλα γλωσσικά μοντέλα όπως το ChatGPT της OpenAI και το Gemini της Google.
Στην καρδιά των μεγάλων γλωσσικών μοντέλων και όσων βασίζονται στη βαθιά μάθηση βρίσκεται μια δομή οργάνωσης που ονομάζεται «tensor», η οποία λειτουργεί σαν… συρταριέρα με αυτοκόλλητες σημειώσεις που δείχνουν ποια συρτάρια χρησιμοποιούνται περισσότερο.
Όταν ένα μοντέλο τεχνητής νοημοσύνης εκπαιδεύεται να εκτελεί μια λειτουργία, όπως αναγνώριση εικόνας ή πρόβλεψη κειμένου, ταξινομεί τα δεδομένα μέσα σε αυτά τα tesnor. Στα σύγχρονα συστήματα τεχνητής νοημοσύνης η ταχύτητα με την οποία τα μοντέλα μπορούν να επεξεργαστούν δεδομένα tensor (να κοιτάξουν τα συρτάρια) αποτελεί έναν θεμελιώδη περιορισμό που θέτει όριο στο πόσο μεγάλα μπορούν να γίνουν τα μοντέλα.
Στη στάνταρτ τεχνολογία λειτουργίας που βασίζεται στο φως τα μοντέλα αναλύουν tensor ενεργοποιώντας διατάξεις λέιζερ πολλές φορές. Λειτουργούν σαν μια μηχανή που σαρώνει έναν γραμμωτό κώδικα για να μάθει τι περιέχει ένα πακέτο μόνο που σε αυτή την περίπτωση κάθε «πακέτο» αντιστοιχεί σε ένα μαθηματικό πρόβλημα. Η απαιτούμενη υπολογιστική ισχύς αυξάνεται ανάλογα με τις εγγενείς δυνατότητες των μοντέλων.
Αν και η οπτική υπολογιστική είναι ταχύτερη και πιο ενεργειακά αποδοτική σε μικρή κλίμακα τα περισσότερα οπτικά συστήματα δεν μπορούν να λειτουργήσουν παράλληλα. Σε αντίθεση με τις μονάδες γραφικών (GPU) οι οποίες μπορούν να συνδεθούν μεταξύ τους ώστε να αυξηθεί εκθετικά η διαθέσιμη υπολογιστική ισχύς τα οπτικά συστήματα συνήθως λειτουργούν γραμμικά. Γι’ αυτό οι περισσότεροι προγραμματιστές απορρίπτουν την οπτική τεχνολογία υπολογιστών υπέρ των πλεονεκτημάτων της παράλληλης επεξεργασίας μέσω ηλεκτρονικού εξοπλισμού.
Αυτό το πρόβλημα κλιμάκωσης είναι ο λόγος που τα πιο ισχυρά μοντέλα από εταιρείες όπως η OpenAI, η Anthropic, η Google και η xAI απαιτούν χιλιάδες GPU να λειτουργούν ταυτόχρονα για να εκπαιδευτούν και να λειτουργήσουν.
Η νέα προσέγγιση
Η νέα αρχιτεκτονική, που ονομάζεται Παράλληλος Οπτικός Πολλαπλασιασμός Μητρώων (POMMM) θα μπορούσε να εξαλείψει το πρόβλημα που κρατούσε πίσω την οπτική υπολογιστική. Σε αντίθεση με προηγούμενες μεθόδους πραγματοποιεί πολλαπλές διεργασίες tensor ταυτόχρονα με έναν μόνο παλμό λέιζερ.
Το αποτέλεσμα είναι ένας θεμελιώδης σχεδιασμός υλικού για τεχνητή νοημοσύνη με δυνατότητα να αυξήσει την ταχύτητα επεξεργασίας tensor πέρα από τις σύγχρονες ηλεκτρονικές δυνατότητες, μειώνοντας ταυτόχρονα το ενεργειακό αποτύπωμα.
Η μελέτη που δημοσιεύτηκε στην επιθεώρηση «Nature Photonics» παρουσιάζει τα αποτελέσματα ενός πειραματικού πρωτοτύπου οπτικής υπολογιστικής καθώς και μια σειρά συγκριτικών δοκιμών με συμβατικές οπτικές μεθόδους και GPU. Οι επιστήμονες χρησιμοποίησαν έναν συγκεκριμένο συνδυασμό συμβατικών οπτικών εξαρτημάτων μαζί με μια νέα μέθοδο κωδικοποίησης και επεξεργασίας για να καταγράψουν και να αναλύσουν πακέτα tensor σε έναν μόνο παλμό λέιζερ.
Κατάφεραν να κωδικοποιήσουν ψηφιακά δεδομένα στο πλάτος και στη φάση των φωτεινών κυμάτων, μετατρέποντας τα δεδομένα σε φυσικές ιδιότητες του οπτικού πεδίου με τα κύματα φωτός να συνδυάζονται ώστε να πραγματοποιούν μαθηματικές λειτουργίες όπως πολλαπλασιασμούς μητρώων ή tensor. Αυτές οι οπτικές λειτουργίες δεν απαιτούν πρόσθετη ενέργεια για να εκτελεστούν επειδή συμβαίνουν παθητικά καθώς το φως διαδίδεται. Αυτό εξαλείφει την ανάγκη για έλεγχο ή μεταγωγή κατά την επεξεργασία καθώς και την ενέργεια που θα χρειαζόταν για αυτές τις λειτουργίες.
«Αυτή η προσέγγιση μπορεί να εφαρμοστεί σχεδόν σε κάθε οπτική πλατφόρμα. Στο μέλλον, σχεδιάζουμε να ενσωματώσουμε αυτό το υπολογιστικό πλαίσιο απευθείας σε φωτονικά τσιπ, επιτρέποντας σε επεξεργαστές βασισμένους στο φως να εκτελούν περίπλοκες εργασίες τεχνητής νοημοσύνης με εξαιρετικά χαμηλή κατανάλωση ενέργειας» λέει ο Ζιπέι Σαν επικεφαλής του Τμήματος Φωτονικής του Πανεπιστημίου Aalto στη Φιλανδία, επικεφαλής της ερευνητικής ομάδας.
Οι ερευνητές εκτιμούν ότι η προσέγγιση αυτή θα μπορούσε να ενσωματωθεί σε μεγάλες πλατφόρμες τεχνητής νοημοσύνης μέσα σε τρία έως πέντε χρόνια.
Επιταχυντής τεχνητής γενικής νοημοσύνης
Οι ερευνητές περιέγραψαν αυτή την πρόοδο ως βήμα προς την επόμενη γενιά Τεχνητής Γενικής Νοημοσύνης (AGI) ενός υποθετικού μελλοντικού συστήματος τεχνητής νοημοσύνης που θα είναι εξυπνότερο από τον άνθρωπο και θα μπορεί να μαθαίνει γενικά σε πολλούς τομείς, ανεξάρτητα από τα δεδομένα εκπαίδευσής του.
«Αυτό θα δημιουργήσει μια νέα γενιά οπτικών συστημάτων υπολογιστικής, επιταχύνοντας σημαντικά πολύπλοκες εργασίες τεχνητής νοημοσύνης σε αμέτρητους τομείς» λένε οι ερευνητές. Αν και η μελέτη δεν αναφέρει συγκεκριμένα την AGI αναφέρεται αρκετές φορές στην γενικής χρήσης υπολογιστική.
Η ιδέα ότι η κλιμάκωση των σημερινών τεχνικών ανάπτυξης τεχνητής νοημοσύνης αποτελεί έναν βιώσιμο δρόμο προς την AGI είναι πολύ διαδεδομένη σε ορισμένους κύκλους της επιστημονικής κοινότητας,
Άλλοι επιστήμονες, όπως ο απερχόμενος επικεφαλής επιστήμονας τεχνητής νοημοσύνης της Metα Γιαν ΛεΚαν, διαφωνούν λέγοντας ότι τα μεγάλα γλωσσικά μοντέλα δεν θα φτάσουν ποτέ το επίπεδο AGI όσο κι αν κλιμακωθούν.
Με το POMMM οι επιστήμονες λένε ότι ίσως έχουν αποκτήσει ένα κρίσιμο κομμάτι του παζλ του υλικού, ικανό να αφαιρέσει έναν από τους μεγαλύτερους περιορισμούς του πεδίου, επιτρέποντας την κλιμάκωση πολύ πέρα από τα θεμελιώδη όρια του σημερινού παραδείγματος.
Naftemporiki.gr

