Βασικά Takeaways
- Fluent είναι μια υπερταχεία μηχανή αναγνώρισης φωνής που σέβεται το απόρρητο και δεν χρειάζεται σύνδεση στο διαδίκτυο.
- Μπορεί να ενσωματωθεί σχεδόν σε οποιαδήποτε συσκευή.
- Λειτουργεί σε οποιαδήποτε γλώσσα.
Το Fluent.ai είναι μια εικονική μηχανή αναγνώρισης φωνής που δεν στέλνει τις εντολές σας στο Διαδίκτυο, ενεργεί σχεδόν αμέσως, μπορεί να λειτουργήσει σε οποιαδήποτε γλώσσα και είναι τόσο μικρή που μπορεί να ενσωματωθεί ακόμη και σε φθηνά, χαμηλά -συσκευές ισχύος όπως ένα ρολόι γυμναστικής, για παράδειγμα.
Σε αντίθεση με τη Siri και την Alexa, το Fluent είναι ένας αυτόνομος βοηθός που σας καταλαβαίνει αμέσως και μαθαίνει από εσάς, ώστε να γίνεται καλύτερο όσο περισσότερο το χρησιμοποιείτε. Δεν έχει το βάθος των τακτικών εικονικών βοηθών, αλλά δεν προορίζεται. Αντίθετα, είναι πιο γρήγορο, πιο ακριβές και πιο ιδιωτικό από τις προσπάθειες της Apple, της Amazon και της Google.
"Η ομιλία σε κείμενο χρησιμοποιεί επεξεργασία φυσικής γλώσσας και στη συνέχεια αντλεί πρόθεση", είπε ο Διευθύνων Σύμβουλος της Fluent, Probal Lala, κατά τη διάρκεια μιας συνέντευξης στο Zoom. "Απαιτεί πολλά δεδομένα και πολλή επεξεργαστική ισχύ. Το Fluent πηγαίνει απευθείας από την ομιλία στην πρόθεση, παίρνει τη φωνή σας και τη μετατρέπει απευθείας σε δράση."
Κατώτατη γραμμή
Το Fluent είναι λογισμικό φωνητικού ελέγχου. Λειτουργεί ακούγοντας την εντολή σας και αφαιρώντας όλες τις λέξεις που δεν χρειάζεται, αφήνοντας μόνο ουσιαστικά και ρήματα. «Σβήσε τα φώτα», γίνεται μόλις σβήνει και ανάβει. Τα ουσιαστικά στοιχεία απογυμνώνονται από μια βρώμικη ανθρώπινη πρόταση και μετατρέπονται σε βήματα. Είναι σχεδόν σαν να προγραμματίζετε έναν υπολογιστή, μετατρέποντας μια σύνθετη ιδέα στο απλούστερο σύνολο οδηγιών.
Γιατί μπορεί να χρησιμοποιηθεί;
Fluent μπορεί να χρησιμοποιηθεί για οτιδήποτε. Το κλειδί είναι ότι είναι εκπαιδευμένο για μια συγκεκριμένη κατάσταση. Με ένα έξυπνο ρολόι, για παράδειγμα, μπορεί να εκπαιδευτεί σε εντολές για φυσική κατάσταση ή για οικιακό αυτοματισμό, δημιουργία ημερολογίου και χρονοδιακόπτη κ.λπ. Ο περιορισμός της βάσης δεδομένων κάνει τα πάντα πιο εστιασμένα και γρήγορα.
"Η αλήθεια του θέματος είναι ότι με τα wearables, δεν θέλεις να κάνεις συζήτηση", είπε η Λάλα, "θέλω ίσως να ξεκινήσει η αγαπημένη μου ρουτίνα άσκησης και να την θέλω πολύ γρήγορα."
Η ταχύτητα και η ακρίβεια είναι η ουσία. Το άναμμα και το σβήσιμο των φώτων διαρκεί χιλιοστά του δευτερολέπτου, αντί να χρειάζεται να περιμένετε να στείλει η Siri τη φωνή σας στο σύννεφο, περιμένετε να υποβληθεί σε επεξεργασία και, στη συνέχεια, δευτερόλεπτα αργότερα, αφού σβήσουν τα φώτα.
Αυτή η στενή εκπαίδευση κρατά επίσης το μέγεθος της εφαρμογής χαμηλό. Πέρυσι, η Google παρείχε μια έκδοση του βοηθού της με δυνατότητα λήψης, εκτός σύνδεσης. Ήταν, λέει ο Lala, 85 Megabyte, λειτουργούσε μόνο στα αγγλικά και χρειάστηκαν έξι μήνες για να το εκπαιδεύσουμε.
"Έχουμε ένα μοντέλο που λειτουργεί με 13.000 εντολές και λειτουργεί σε 500 kilobyte", είπε.
Κατώτατη γραμμή
Το άλλο πλεονέκτημα μιας μηχανής αναγνώρισης φωνής εκτός σύνδεσης είναι το απόρρητο. Σε ένα παιδικό έξυπνο ρολόι, για παράδειγμα, "δεν θέλετε η φωνή ενός παιδιού να πηγαίνει στο σύννεφο", λέει ο Lala. Στην πραγματικότητα, το Fluent μπορεί να λειτουργήσει μέσα σε συσκευές που δεν συνδέονται ποτέ στο διαδίκτυο. Αυτό δεν είναι μόνο καλό για την ιδιωτικότητα, αλλά και για την ασφάλεια. Θα μπορούσατε να χρησιμοποιήσετε μια μηχανή αναγνώρισης φωνής εκτός σύνδεσης σε ερευνητικά εργαστήρια, στρατιωτικές εγκαταστάσεις και άλλα μέρη που απαγορεύουν τα κινητά τηλέφωνα και τις κάμερες.
Όρια
Φυσικά, υπάρχουν ορισμένα μειονεκτήματα σε αυτό το μοντέλο. Το ένα είναι ότι οι εντολές δεν μπορούν να προστεθούν αργότερα. Μόλις ολοκληρωθεί η αρχική εκπαίδευση, αυτό είναι. Ούτε ο βοηθός σας που βασίζεται στο Fluent μπορεί να ψάξει τα πράγματα στο Διαδίκτυο για τις βαθμολογίες των αθλημάτων σας, τον ηθοποιό που αναγνωρίζετε σε αυτήν την ταινία, αλλά απλά δεν μπορείτε να τοποθετήσετε και ούτω καθεξής.
Αντίθετα, το σύστημα είναι αρκετά έξυπνο ώστε να αναγνωρίζει πότε δεν μπορεί να βοηθήσει και θα παραδώσει το αίτημα σε κάτι που μπορεί. Αν ρωτήσετε το ρολόι σας για την πρόγνωση του καιρού, το Fluent θα καταλάβει ότι δεν καταλαβαίνει. "Στη συνέχεια θα καλέσει μια υπηρεσία που είναι προγραμματισμένη εκ των προτέρων στο ρολόι, είτε είναι η Alexa της Amazon είτε η Google, και στη συνέχεια θα πραγματοποιήσει μια κλήση στο cloud, " μεταβιβάζοντας την ακατέργαστη φωνητική σας εντολή για να λάβει την απάντηση.
Αυτή η υβριδική προσέγγιση διατηρεί την ταχύτητα ενός τοπικού βοηθού εκτός σύνδεσης, με τη δύναμη της Alexa ή του Βοηθού Google ως εφεδρικό.
Μπορείτε να αγοράσετε οποιεσδήποτε Fluent Devices;
Όχι ακόμα. Η εταιρεία αδειοδοτεί την τεχνολογία της και κάνει την εκπαίδευση για άλλες εταιρείες. Χάρη στον COVID, δύο μεγάλες εκκινήσεις αναβλήθηκαν για το επόμενο έτος. Αλλά μπορείτε να περιμένετε να το δείτε να εμφανίζεται σε ρολόγια και άλλες συσκευές γυμναστικής, ηχεία, κόμβους οικιακού αυτοματισμού και ούτω καθεξής.
Θα ήταν υπέροχο εάν αυτό ενσωματωνόταν απευθείας σε smartphone όπως το iPhone, κάνοντας τις καθημερινές εργασίες πιο γρήγορες και καταφεύγοντας στο Siri μόνο όταν είναι απαραίτητο. Αυτή θα ήταν η πραγματική εφαρμογή δολοφόνος.
Ενημέρωση: 22 Οκτωβρίου, 10:12 π.μ. Πραγματοποίησε αλλαγές για να αναφέρεται στο Fluent ως μηχανή αναγνώρισης φωνής και όχι ως βοηθός φωνής.