Βασικά Takeaways
- Το σύστημα AI που ονομάζεται DALL-E2 φαίνεται να έχει δημιουργήσει το δικό του σύστημα γραπτής επικοινωνίας.
- Μερικοί ειδικοί λένε ότι η φαινομενική γλώσσα μπορεί να είναι απλώς ασυναρτησίες.
- Είναι ένα παράδειγμα του πόσο δύσκολο είναι να ερμηνευτούν τα αποτελέσματα προηγμένων συστημάτων τεχνητής νοημοσύνης.
Φαίνεται ότι η Τεχνητή Νοημοσύνη (AI) έχει αναπτύξει τη δική της γλώσσα, αλλά ορισμένοι ειδικοί είναι δύσπιστοι ως προς τον ισχυρισμό.
Το σύστημα τεχνητής νοημοσύνης κειμένου σε εικόνα του OpenAI που ονομάζεται DALL-E2 φαίνεται να έχει δημιουργήσει το δικό του σύστημα γραπτής επικοινωνίας. Είναι ένα παράδειγμα του πόσο δύσκολο είναι να ερμηνευτούν τα αποτελέσματα προηγμένων συστημάτων τεχνητής νοημοσύνης.
"Λόγω του μεγέθους και του βάθους των μεγάλων μοντέλων, είναι πολύ δύσκολο να εξηγηθεί η συμπεριφορά των μοντέλων", είπε η Teresa O'Neill, διευθύντρια αρχιτεκτονικής λύσεων για την κατανόηση φυσικής γλώσσας στο iMerit, σε μια συνέντευξη στο Lifewire. "Αυτή είναι μια από τις βασικές προκλήσεις και σε ορισμένες περιπτώσεις, ηθικά ζητήματα με ολοένα και πιο ισχυρά μοντέλα. Εάν δεν μπορούμε να εξηγήσουμε γιατί συμπεριφέρονται όπως συμπεριφέρονται, μπορούμε να προβλέψουμε τη συμπεριφορά τους ή να τη διατηρήσουμε σύμφωνα με τους κανόνες και τις προσδοκίες μας;"
Συζητήσεις AI
Ο φοιτητής Επιστήμης Υπολογιστών Γιάννης Δάρας σημείωσε πρόσφατα ότι το σύστημα DALLE-2, το οποίο δημιουργεί εικόνες με βάση την εισαγωγή κειμένου, θα επέστρεφε ανοησίες ως κείμενο υπό ορισμένες συνθήκες.
"Ένας γνωστός περιορισμός του DALLE-2 είναι ότι δυσκολεύεται με το κείμενο", έγραψε σε μια εργασία που δημοσιεύτηκε στον διακομιστή προεκτύπωσης Arxiv. "Για παράδειγμα, μηνύματα κειμένου όπως: "Μια εικόνα της λέξης αεροπλάνο" συχνά οδηγούν σε εικόνες που δημιουργούνται που απεικονίζουν ασυνήθιστο κείμενο."
Αλλά, έγραψε ο Daras, μπορεί να υπάρχει μια μέθοδος πίσω από την προφανή ασυναρτησία. «Ανακαλύπτουμε ότι αυτό το παραγόμενο κείμενο δεν είναι τυχαίο, αλλά μάλλον αποκαλύπτει ένα κρυμμένο λεξιλόγιο που το μοντέλο φαίνεται να έχει αναπτύξει εσωτερικά», συνέχισε. "Για παράδειγμα, όταν τροφοδοτείται με αυτό το ασυνήθιστο κείμενο, το μοντέλο παράγει συχνά αεροπλάνα."
Στο tweet του, ο Daras επεσήμανε ότι όταν ζητήθηκε από το DALLE-2 να υποτιτλίσει μια συνομιλία μεταξύ δύο αγροτών, τους έδειξε να μιλούν, αλλά τα συννεφάκια ομιλίας ήταν γεμάτα με κάτι που έμοιαζε με ανόητες λέξεις. Όμως ο Ντάρας ανακάλυψε ότι οι λέξεις φαίνεται να έχουν το δικό τους νόημα για την τεχνητή νοημοσύνη: οι αγρότες μιλούσαν για λαχανικά και πουλιά.
Nicola Davolio, Διευθύνων Σύμβουλος της εταιρείας τεχνολογίας Hupry, που συνεργάζεται με την τεχνητή νοημοσύνη, εξήγησε στο Lifewire σε μια συνέντευξη μέσω email ότι η γλώσσα βασίζεται σε σύμβολα που το σύστημα DALL-E2 έχει μάθει να συσχετίζει με ορισμένες έννοιες. Για παράδειγμα, το σύμβολο για "σκύλος" μπορεί να σχετίζεται με την εικόνα ενός σκύλου, ενώ το σύμβολο για "γάτα" μπορεί να σχετίζεται με μια εικόνα μιας γάτας. Το DALL-E2 δημιούργησε τη γλώσσα του επειδή του επιτρέπει να επικοινωνεί πιο αποτελεσματικά με άλλα συστήματα τεχνητής νοημοσύνης.
Γρίφοι όπως το φαινομενικά κρυμμένο λεξιλόγιο του DALL-E2 είναι διασκεδαστικό να παλέψεις, αλλά τονίζουν επίσης πιο βαριές ερωτήσεις…
"Η γλώσσα αποτελείται από σύμβολα που μοιάζουν με αιγυπτιακά ιερογλυφικά και δεν φαίνεται να έχουν κάποιο συγκεκριμένο νόημα", πρόσθεσε. "Τα σύμβολα είναι πιθανώς χωρίς νόημα για τους ανθρώπους, αλλά έχουν απολύτως νόημα για το σύστημα τεχνητής νοημοσύνης, καθώς έχει εκπαιδευτεί σε εκατομμύρια εικόνες."
Οι ερευνητές πιστεύουν ότι το σύστημα AI δημιούργησε τη γλώσσα για να το βοηθήσει να κατανοήσει καλύτερα τις σχέσεις μεταξύ εικόνων και λέξεων, είπε ο Davolio.
"Δεν είναι σίγουροι γιατί το σύστημα τεχνητής νοημοσύνης ανέπτυξε τη γλώσσα του, αλλά υποψιάζονται ότι μπορεί να έχει σχέση με το πώς μάθαινε να δημιουργεί εικόνες", πρόσθεσε ο Davolio. «Είναι πιθανό ότι το σύστημα τεχνητής νοημοσύνης ανέπτυξε τη γλώσσα του για να κάνει την επικοινωνία μεταξύ των διαφορετικών τμημάτων του δικτύου πιο αποτελεσματική."
Μυστήρια AI
Το DALL-E2 δεν είναι το μόνο σύστημα τεχνητής νοημοσύνης που έχει αναπτύξει την εσωτερική του γλώσσα, επεσήμανε ο Davolio. Το 2017, το σύστημα AutoML της Google δημιούργησε μια νέα μορφή νευρωνικής αρχιτεκτονικής που ονομάζεται «παιδικό δίκτυο», αφού αφέθηκε να αποφασίσει πώς να ολοκληρώσει καλύτερα μια δεδομένη εργασία. Αυτό το παιδικό δίκτυο ήταν ανίκανο να ερμηνευτεί από τους ανθρώπινους δημιουργούς του.
"Αυτά τα παραδείγματα είναι μόνο μερικές περιπτώσεις στις οποίες τα συστήματα τεχνητής νοημοσύνης έχουν αναπτύξει τρόπους να κάνουν πράγματα που δεν μπορούμε να εξηγήσουμε", είπε ο Davolio. "Είναι ένα αναδυόμενο φαινόμενο που είναι συναρπαστικό και ανησυχητικό εξίσου. Καθώς τα συστήματα τεχνητής νοημοσύνης γίνονται πιο περίπλοκα και αυτόνομα, μπορεί να βρισκόμαστε όλο και περισσότερο στη θέση να μην καταλαβαίνουμε πώς λειτουργούν."
Η O'Neill είπε ότι δεν πιστεύει ότι το DALL-E2 δημιουργεί τη δική του γλώσσα. Αντίθετα, είπε ότι ο λόγος για τη φαινομενική γλωσσική εφεύρεση είναι μάλλον λίγο πιο πεζός.
"Μια εύλογη εξήγηση είναι μια τυχαία πιθανότητα -- σε ένα μοντέλο τόσο μεγάλο, μπορεί να ισχύει ένα κομμάτι του νόμου του Μέρφι: αν μπορεί να συμβεί κάτι περίεργο, πιθανότατα θα συμβεί", πρόσθεσε ο Ο'Νιλ. Μια άλλη πιθανότητα που προτείνει ο ερευνητικός αναλυτής Benjamin Hilton σε ένα νήμα στο Twitter που συζητούσε τα ευρήματα του Daras είναι ότι η μορφή της φράσης "apoploe vesrreaitais" μιμείται τη μορφή ενός λατινικού ονόματος για ένα ζώο. Έτσι, το σύστημα έχει δημιουργήσει μια νέα σειρά Aves, πρόσθεσε ο O'Neill.
"Γρίφοι όπως το φαινομενικά κρυμμένο λεξιλόγιο του DALL-E2 είναι διασκεδαστικό να παλέψεις, αλλά τονίζουν επίσης βαρύτερα ερωτήματα σχετικά με τον κίνδυνο, την προκατάληψη και την ηθική στη συχνά ανεξιχνίαστη συμπεριφορά μεγάλων μοντέλων", είπε ο O'Neill..