Οι υπότιτλοι και οι μεταφράσεις σε πραγματικό χρόνο μπορεί να είναι το μέλλον της συνομιλίας βίντεο

Πίνακας περιεχομένων:

Οι υπότιτλοι και οι μεταφράσεις σε πραγματικό χρόνο μπορεί να είναι το μέλλον της συνομιλίας βίντεο
Οι υπότιτλοι και οι μεταφράσεις σε πραγματικό χρόνο μπορεί να είναι το μέλλον της συνομιλίας βίντεο
Anonim

Βασικά Takeaways

  • Το Navi χρησιμοποιεί το SharePlay και την ενσωματωμένη ομιλία σε κείμενο της Apple, για να προσφέρει υπότιτλους και μεταφράσεις στο FaceTime.
  • Είναι πολύ μακριά από το τέλειο, αλλά ήδη αρκετά καλό.
  • Οι υπότιτλοι είναι ιδανικοί για προσβασιμότητα.
Image
Image

Το Το Navi είναι μια εφαρμογή που προσθέτει ζωντανούς υπότιτλους και μεταφράσεις σε πραγματικό χρόνο στις κλήσεις FaceTime.

Η εφαρμογή χρησιμοποιεί το SharePlay και την ενσωματωμένη Αναγνώριση ομιλίας για να προσθέτει υπότιτλους και μεταφράσεις σε 20 γλώσσες στις κλήσεις FaceTime. Είναι μια απίστευτη χρήση του SharePlay, το οποίο οι περισσότεροι από εμάς θεωρούμε ως έναν απλό τρόπο παρακολούθησης συγχρονισμένων ταινιών με άτομα σε άλλα μέρη. Ίσως να μην χρειαστεί να απολύσετε ακόμα τον μεταφραστή σας, αλλά μια εφαρμογή που το κάνει καλά θα μπορούσε να είναι εξαιρετικά χρήσιμη.

"Δεν λαμβάνω τον ήχο από την κλήση FaceTime", γράφει ο προγραμματιστής του Navi Jordi Bruin στο Twitter, "αλλά χρησιμοποιώ το SharePlay για να τον μοιραστώ μεταξύ των συμμετεχόντων στην κλήση."

SharePlay

Το Το SharePlay είναι μια νέα δυνατότητα στο iOS 15 και στο macOS 12.1 που σας επιτρέπει να μοιράζεστε και να συγχρονίζετε πράγματα στις κλήσεις FaceTime. Με το παραπάνω παράδειγμα παρακολούθησης ταινίας, οποιοσδήποτε συμμετέχων μπορεί να διακόψει ή να παίξει την ταινία, για παράδειγμα, ενώ όλοι συνομιλείτε στην κλήση FaceTime. Το βίντεο FaceTime παραμένει ανοιχτό σε ένα μικρό, αιωρούμενο πλαίσιο εικόνας σε εικόνα και κάθε συμμετέχων εκτελεί την εφαρμογή τοπικά στη συσκευή του. Το κόλπο του SharePlay είναι να συγχρονίζει οτιδήποτε συμβαίνει σε αυτές τις τοπικές εφαρμογές, έτσι ώστε όλοι να μοιράζονται την εμπειρία, είτε πρόκειται για ταινία, είτε για προπόνηση Fitness+ είτε για υπολογιστικό φύλλο.

Το Navi χρησιμοποιεί την ίδια τεχνολογία, μόνο που η εφαρμογή κατά την κλήση δεν είναι ταινία - είναι μηχανή μετάφρασης σε πραγματικό χρόνο. Για να τη χρησιμοποιήσετε, εκκινείτε την εφαρμογή ενώ βρίσκεστε σε κλήση FaceTime και πατάτε το κουμπί «Ενεργοποίηση υποτίτλων». Στη συνέχεια, άλλοι συμμετέχοντες μπορούν επίσης να συμμετάσχουν στη δράση και να δουν ζωντανούς υπότιτλους για τον τρέχοντα ομιλητή. Αν κάποιος μονολογεί, το συννεφάκι του λόγου του μεγαλώνει και κολλάει λίγο περισσότερο.

Image
Image

Για τους κωφούς, αυτό θα μπορούσε να σημαίνει τη διαφορά μεταξύ κλήσης ατόμων ή όχι. Και για οποιονδήποτε, σημαίνει ότι μπορείτε να κάνετε χρήσιμες συνομιλίες μεταξύ ατόμων που δεν μοιράζονται μια γλώσσα.

Καθολικό κείμενο

Το Διαδίκτυο βασίζεται σε κείμενο και αυτό είναι υπέροχο. Είναι μικρό και εύκολο στη δημιουργία, ανάγνωση και μετάφραση. Είναι επίσης απλό να μετατραπεί σε συνθετική ομιλία. Το αποτέλεσμα είναι ότι οποιοσδήποτε από οπουδήποτε μπορεί να συμμετέχει σε οποιαδήποτε συζήτηση. Η γλώσσα δεν αποτελεί εμπόδιο, ούτε η κώφωση ή οποιοδήποτε είδος τύφλωσης - εφόσον χρησιμοποιείτε μια συσκευή με καλά εργαλεία προσβασιμότητας για προβλήματα όρασης ή ακοής.

Αλλά ο προφορικός λόγος είναι πολύ πιο δύσκολο να επεξεργαστεί. Η υπαγόρευση ομιλίας σε κείμενο είναι εντυπωσιακή, αλλά μόλις σχετικά πρόσφατα η γενική αναγνώριση ομιλίας έχει γίνει αρκετά καλή για γενική χρήση - η εφαρμογή Translate της Apple είναι ένα καλό παράδειγμα. Παρουσιάστηκε στο iOS 15, προσφέρει μεταφράσεις ήχου σε πραγματικό χρόνο. Αν πάλι πηγαίναμε διακοπές στο εξωτερικό, θα ήταν τέλεια.

Τώρα χρησιμοποιούμε όλο και περισσότερο βίντεο για δουλειά και για να παραμείνουμε σε επαφή με φίλους και οικογένεια. Ανεξάρτητα από το πώς θα εργαστούμε στο μέλλον, το εμπόδιο στις βιντεοκλήσεις έχει καταρρεύσει πλήρως. Είναι πλέον ένα κοινό εργαλείο, αλλά του λείπει πολύ η φινέτσα των εργαλείων γραπτής επικοινωνίας.

Κάτι σαν το Navi, που προσφέρει υπότιτλους και μετάφραση σε πραγματικό χρόνο, θα μπορούσε να είναι σημαντικό. Η προσβασιμότητα είναι μια πτυχή, αλλά η ικανότητα να συνομιλείτε με άτομα των οποίων τη γλώσσα δεν μιλάτε ανοίγει σε εκπληκτικό βαθμό τις διεθνείς επιχειρήσεις.

Image
Image

Σε Δράση

Δοκίμασα το Navi με τον προγραμματιστή εφαρμογών, τον συγγραφέα και τον χρήστη ακουστικών βαρηκοΐας Graham Bower. Είναι αρκετά καλό αλλά δεν είναι ακόμα έτοιμο για κρίσιμες εργασίες. Μερικές από τις μεταγραφές ήταν κωμικά κακές και πολύ χυδαίο για να τις σχετίζονταν. Καθώς συνεχιζόταν η συζήτησή μας, όμως, έγινε πολύ καλύτερη στην ακριβή αναγνώριση της ομιλίας του. Αυτό είναι λογικό επειδή η μηχανή υπαγόρευσης iOS προσαρμόζεται στη φωνή σας με την πάροδο του χρόνου.

Η μετάφραση λειτούργησε επίσης, αν και η ποιότητα των μεταφράσεων της εξαρτάται από την ακρίβεια της εισαγωγής.

Είναι εύκολο να προβάλλετε αυτό το είδος τεχνολογίας στα μελλοντικά γυαλιά Apple ή σε οποιοδήποτε προϊόν AR/VR που φημολογείται ότι δουλεύει αυτήν την εβδομάδα.

"Μπορώ να το δω αυτό να λειτουργεί με γυαλιά AR", είπε ο Bower κατά τη διάρκεια της συζήτησής μας. "Μερικοί άνθρωποι, ακόμη και με κανονική ακοή, προτιμούν τους υπότιτλους σε ταινίες. Αυτό θα ήταν σαν υπότιτλοι για την πραγματική ζωή."

Ενώ μια εντυπωσιακή επίδειξη τεχνολογίας, το Navi δεν είναι ακόμα εκεί. Για αξιόπιστη επαγγελματική χρήση, η αρχική αναγνώριση ομιλίας της Apple θα πρέπει να είναι πολύ πιο ακριβής. Αλλά από άποψη ταχύτητας, είναι μια χαρά, και οι μεταφράσεις είναι τόσο καλές όσο όλες.

Αλλά βρισκόμαστε στο δρόμο τώρα, και αυτό το είδος των πραγμάτων θα βελτιωθεί.

Συνιστάται: