Η νέα τεχνολογία θα μπορούσε να επιτρέψει στα gadget να κατανοήσουν τις συνομιλίες σας

Πίνακας περιεχομένων:

Η νέα τεχνολογία θα μπορούσε να επιτρέψει στα gadget να κατανοήσουν τις συνομιλίες σας
Η νέα τεχνολογία θα μπορούσε να επιτρέψει στα gadget να κατανοήσουν τις συνομιλίες σας
Anonim

Βασικά Takeaways

  • Οι νέες τεχνολογίες θα μπορούσαν να οδηγήσουν σε υπολογιστές που κατανοούν καλύτερα την ανθρώπινη ομιλία.
  • Η Microsoft και η NVIDIA ανακοίνωσαν πρόσφατα μια νέα μέθοδο που βασίζεται στην τεχνητή νοημοσύνη για την ερμηνεία της γλώσσας.
  • Ο κβαντικός υπολογιστής μπορεί να είναι ένας άλλος τρόπος για να προχωρήσετε στον τομέα της επεξεργασίας γλώσσας.
Image
Image

Υπάρχουν πολλά έξυπνα gadget για να δίνουμε εντολές στις μέρες μας, αλλά είμαστε ακόμα πολύ μακριά από υπολογιστές που κατανοούν την ομιλία.

Η Microsoft και η NVIDIA ανακοίνωσαν πρόσφατα μια νέα μέθοδο με γνώμονα την τεχνητή νοημοσύνη για την ερμηνεία της ομιλίας που θα μπορούσε να μεταμορφώσει τον τρόπο που συνομιλούμε με τα ηλεκτρονικά μας. Είναι μέρος ενός αυξανόμενου κινήματος που αλλάζει τον τρόπο με τον οποίο οι υπολογιστές κατανοούν την ομιλία, που ονομάζεται επίσης Επεξεργασία Φυσικής Γλώσσας (NLP).

"Τα μοντέλα που τροφοδοτούν το NLP γίνονται μεγαλύτερα και πιο προηγμένα και πλησιάζουν περισσότερο στην ανθρώπινη κατανόηση", είπε ο ειδικός AI Hamish Ogilvy σε μια συνέντευξη στο Lifewire.

"Μία από τις μεγάλες εξελίξεις είναι ότι το NLP υπερβαίνει τις απλές λέξεις-κλειδιά. Μπορεί σήμερα να είστε συνηθισμένοι να πληκτρολογείτε ή να εκφωνείτε μία ή δύο λέξεις-κλειδιά για να λαμβάνετε αποτελέσματα αναζήτησης, αλλά τα νεότερα μοντέλα επεξεργασίας φυσικής γλώσσας χρησιμοποιούν το πλαίσιο για να παρέχουν πιο πλούσια αποτελέσματα."

Chat Bots

Η NVIDIA και η Microsoft συνεργάστηκαν για να δημιουργήσουν το μοντέλο Megatron-Turing Natural Language Generation (MTNLG), το οποίο το δίδυμο ισχυρίζεται ότι είναι το "πιο ισχυρό μοντέλο γλώσσας μονολιθικού μετασχηματιστή που έχει εκπαιδευτεί μέχρι σήμερα". Το μοντέλο AI τρέχει σε υπερυπολογιστές.

Αλλά οι ερευνητές διαπίστωσαν ότι το μοντέλο MTNLG εντόπισε ανθρώπινες προκαταλήψεις καθώς χτένιζε βουνά από δείγματα ανθρώπινης ομιλίας.

"Ενώ τα γιγάντια γλωσσικά μοντέλα προχωρούν στην τελευταία λέξη της τεχνολογίας στη δημιουργία γλώσσας, υποφέρουν επίσης από ζητήματα όπως η μεροληψία και η τοξικότητα", έγραψαν οι ερευνητές σε μια ανάρτηση ιστολογίου. "Οι παρατηρήσεις μας με το MT-NLG είναι ότι το μοντέλο συλλαμβάνει στερεότυπα και προκαταλήψεις από τα δεδομένα στα οποία έχει εκπαιδευτεί."

Οι υπολογιστές που κατανοούν καλύτερα την ομιλία δεν θα βελτιώσουν απλώς τα έξυπνα ηχεία όπως η Alexa, υποστηρίζει ο Ogilvy. Οι ιστότοποι αναζήτησης που βασίζονται σε κείμενο, όπως το Amazon, θα κατανοούν επίσης καλύτερα τα ερωτήματα που πληκτρολογούνται.

"Η Google είχε το προφανές προβάδισμα εδώ, αλλά η τεχνολογία NLP θα είναι παντού", είπε ο Ogilvy. "Για τις αναζητήσεις που βασίζονται σε κείμενο και φωνή, οι χρήστες μπορούν να είναι πιο περιγραφικοί επειδή το NLP κατανοεί περισσότερα από το κείμενο· κατανοεί το πλαίσιο αυτού που αναζητάτε για να αποδώσει καλύτερα αποτελέσματα."

Quantum Chats;

Οι κβαντικοί υπολογιστές μπορεί να είναι ένας τρόπος για να προχωρήσετε στον τομέα του NLP. Την Τετάρτη, η εταιρεία Cambridge Quantum ανακοίνωσε το lambeq, το οποίο ισχυρίζεται ότι είναι το πρώτο κβαντικό εργαλείο για το NLP.

…Το NLP κατανοεί περισσότερα από το κείμενο. κατανοεί το πλαίσιο αυτού που αναζητάτε για να έχετε καλύτερα αποτελέσματα.

Η εταιρεία λέει ότι το εργαλείο επιτρέπει τη μετάφραση προτάσεων σε φυσικές γλώσσες χρησιμοποιώντας κβαντικά κυκλώματα που εκτελούνται σε κβαντικούς υπολογιστές. Ο κβαντικός υπολογισμός είναι ένας τύπος υπολογισμού που χρησιμοποιεί τις ασυνήθιστες ιδιότητες των κβαντικών καταστάσεων, όπως η υπέρθεση, η παρεμβολή και η εμπλοκή, για την εκτέλεση υπολογισμών.

"Ο τρόπος με τον οποίο οι κβαντικοί υπολογιστές χειρίζονται το NLP είναι πολύ διαφορετικός από τις κλασικές μηχανές. Στην πραγματικότητα, το NLP είναι "κβαντικό εγγενές", είπε ο Bob Coecke, ο επικεφαλής επιστήμονας στο Cambridge Quantum, σε μια συνέντευξη μέσω email στο Lifewire. «Αυτό οφείλεται σε μια ανακάλυψη που κάναμε πριν από μερικά χρόνια, ότι η γραμματική που διέπει τις προτάσεις και το νόημα έχει παρόμοια δομή με τα μαθηματικά που χρησιμοποιούνται για τον προγραμματισμό των κβαντικών υπολογιστών."

Coecke είπε ότι το κβαντικό NLP θα μπορούσε να οδηγήσει σε καλύτερους βοηθούς φωνής και εργαλεία μετάφρασης.

Μια άλλη πολλά υποσχόμενη προσέγγιση για τη βελτίωση της αναγνώρισης ομιλίας, που ονομάζεται Zac Liu, ένας επιστήμονας δεδομένων στην εταιρεία Hypergiant, είπε στο Lifewire σε μια συνέντευξη μέσω email. "Εν ολίγοις, όταν οι επιστήμονες δεδομένων βελτιώνουν τα δεδομένα NLP, σχεδόν εγγυάται ότι θα έχουν καλύτερο μοντέλο NLP και καλύτερη ικανότητα NLP."

Image
Image

Το επόμενο βήμα είναι η ενσωμάτωση μοντέλων όρασης υπολογιστή με το NLP, όπως η εκπαίδευση ενός μοντέλου τεχνητής νοημοσύνης για να παρακολουθεί βίντεο και να δημιουργεί μια σύνοψη κειμένου αυτού του βίντεο, είπε ο Liu.

"Η εφαρμογή αυτής της προόδου θα μπορούσε να είναι απεριόριστη, από την υγειονομική περίθαλψη, την ανάγνωση ακτινολογικών ταινιών και την παροχή προκαταρκτικής διάγνωσης, μέχρι το σχεδιασμό σπιτιών, ρούχων, κοσμημάτων ή παρόμοιων αντικειμένων", πρόσθεσε. «Ο πελάτης θα μπορούσε να εξηγήσει τις απαιτήσεις προφορικά ή γραπτά και αυτή η περιγραφή μπορεί να μετατραπεί αυτόματα σε εικόνες ή βίντεο για καλύτερη οπτικοποίηση."

Συνιστάται: