Πώς λειτουργεί η λειτουργία Hum to Search της Google

Πίνακας περιεχομένων:

Πώς λειτουργεί η λειτουργία Hum to Search της Google
Πώς λειτουργεί η λειτουργία Hum to Search της Google
Anonim

Βασικά Takeaways

  • Η Google κυκλοφόρησε ένα νέο εργαλείο που επιτρέπει στους χρήστες να αναζητούν τραγούδια βουίζοντας, τραγουδώντας ή σφυρίζοντας.
  • Το νέο εργαλείο χρησιμοποιεί μηχανική εκμάθηση για να ταιριάξει ένα κομμάτι με βουητό με μια βάση δεδομένων με περισσότερα από μισό εκατομμύριο τραγούδια που ενημερώνεται συνεχώς.
  • Οι χρήστες της Google ρωτούν ποιο τραγούδι παίζει σχεδόν 100 φορές κάθε μήνα.
Image
Image

Η Google κυκλοφόρησε μια νέα λειτουργία που ονομάζεται "Hum to Search" για να λύσει ένα απογοητευτικό πρόβλημα: να έχετε ένα τραγούδι κολλημένο στο κεφάλι σας και να μην μπορείτε να καταλάβετε πώς λέγεται.

Η ιδέα του βουητού για να βρεις ένα τραγούδι φαίνεται απίστευτα απλή, οπότε γιατί η Google λανσάρει αυτήν τη λειτουργία μόνο το 2020; Λοιπόν, αποδεικνύεται ότι η αναγνώριση των τραγουδιών με αυτόν τον τρόπο είναι στην πραγματικότητα πολύ περίπλοκη, εν μέρει επειδή οι βουητό μας εκδοχές τείνουν να είναι αρκετά διαφορετικές από το αρχικό κομμάτι. Σε μια πρόσφατη ανάρτηση στο ιστολόγιο τεχνητής νοημοσύνης της, η Google εξηγεί πώς χρησιμοποίησε τη μηχανική εκμάθηση για να διορθώσει αυτό το πρόβλημα και τελικά βοηθά τους ανθρώπους να βρουν ένα τραγούδι βουίζοντας, σφυρίζοντας ή τραγουδώντας τη μελωδία ακόμα και όταν η απόδοση τους είναι λιγότερο ακριβής.

"Η εστίασή μας για το Hum to Search είναι να βοηθήσουμε τους ανθρώπους να εντοπίσουν και να βρουν μουσική που έχει κολλήσει στο κεφάλι τους", είπε ένας εκπρόσωπος της Google στο Lifewire σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου.

Απλώς ξεκινήστε το βουητό

Οι χρήστες της Google ρωτούν ποιο τραγούδι παίζει σχεδόν 100 εκατομμύρια φορές κάθε μήνα, είπε η Aparna Chennapragada, αντιπρόεδρος της Google και γενικός διευθυντής αγορών καταναλωτών, ένα βίντεο που παρουσιάζει πολλές νέες δυνατότητες αναζήτησης. Τώρα υπάρχει τρόπος να το μάθετε.

Η λειτουργία "Hum to Search" είναι ενσωματωμένη στην εφαρμογή για κινητά της Google, στο γραφικό στοιχείο Αναζήτησης Google και στον Βοηθό Google. Για να αποκτήσετε πρόσβαση μέσω της εφαρμογής, πατήστε το εικονίδιο του μικροφώνου και πείτε "What's this song?" Η επιλογή του κουμπιού "Αναζήτηση τραγουδιού" λειτουργεί επίσης.

Για να λειτουργήσει σωστά, η λειτουργία απαιτεί να βουίζεις για τουλάχιστον 10-15 δευτερόλεπτα. Οι χρήστες Android μπορούν να βουίζουν για να βρουν τραγούδια σε περισσότερες από 20 γλώσσες, ενώ μόνο τα αγγλικά τραγούδια λειτουργούν σε iPhone. Το εργαλείο δεν είναι πάντα σε θέση να αναγνωρίσει ένα τραγούδι αμέσως, αλλά μόλις το κάνει, τα αποτελέσματα είναι πολύ καλά.

"Περισσότερα από τα μισά τραγούδια ενός ευρέος συνόλου μεταβλητών (τόνος, ύψος, ένταση κ.λπ.) αναγνωρίζονται από τους αλγόριθμούς μας, αλλά φυσικά η ακρίβεια εξαρτάται από την ποιότητα του βουητού, τον τύπο το τραγούδι και πολλά άλλα», είπε ο εκπρόσωπος της Google στο Lifewire σε ένα email. "Αλλά μόλις αναγνωριστεί, περίπου τέσσερις στις πέντε απαντήσεις είναι σωστές."

Δεν είναι όμως η πρώτη φορά που το βουητό χρησιμοποιείται σε εφαρμογή αναγνώρισης μουσικής. Το SoundHound προσφέρει μια παρόμοια λειτουργία, όπως σημειώνεται από το CNN Business, και είναι επίσης διαθέσιμη σε Android και iOS. Σύμφωνα με τον εκπρόσωπο της Google, η νέα λειτουργία δεν εγείρει ανησυχίες για το απόρρητο, ούτε "αλλάζει τον τρόπο που η Google χειρίζεται τις αλληλεπιδράσεις που βασίζονται στον ήχο", είπαν στο Lifewire σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου.

Μηχανική Εκμάθηση

Παρά την απλότητα της ιδέας, η μελωδία για να βρεις την ηχογράφηση στο στούντιο είναι τεχνικά αρκετά δύσκολη. Υπάρχουν διάφοροι λόγοι για αυτό, εξηγεί ο Christian Frank της Google Research σε μια ανάρτηση ιστολογίου στις 12 Νοεμβρίου. Πρώτα απ 'όλα, μια βουητό έκδοση του τραγουδιού μπορεί να διαφέρει πολύ από την πραγματική ηχογράφηση, καθιστώντας δύσκολη την αντιστοίχιση των δύο. Έτσι, ενώ το Shazam και μια σειρά από άλλες εφαρμογές υπάρχουν ήδη για την αναγνώριση αυτού του τραγουδιού που ακούτε σε ένα εστιατόριο ή άλλο δημόσιο χώρο, η χρήση μιας μελωδίας με βουητό ως βάση για αυτήν την αναζήτηση μπορεί να είναι πιο δύσκολη.

"Με τους στίχους, τα φωνητικά και τα όργανα, ο ήχος μιας ηχογράφησης μιούζικαλ ή στούντιο μπορεί να είναι αρκετά διαφορετικός από μια μελωδία με βουητό", γράφει ο Frank."Κατά λάθος ή σχεδιασμό, όταν κάποιος βουίζει την ερμηνεία του ενός τραγουδιού, συχνά το ύψος, το πλήκτρο, ο ρυθμός ή ο ρυθμός μπορεί να διαφέρουν ελαφρώς ή και σημαντικά."

Image
Image

Επειδή οι εκδοχές των τραγουδιών με βουητό μπορεί να είναι τόσο διαφορετικές από τις πρωτότυπες, ο Frank σημειώνει ότι πολλές προηγούμενες μέθοδοι απαιτούσαν την αντιστοίχιση του βουητού ενός ατόμου με μια έκδοση του τραγουδιού που έχει μόνο μια μελωδία ή ένα κομμάτι που περιλαμβάνει βουητό. Αυτό έχει κάνει τις περιπτώσεις χρήσης του πραγματικού κόσμου δύσκολες, καθώς οι βάσεις δεδομένων με αυτά τα τραγούδια μπορεί να είναι περιορισμένες και πρέπει να ενημερωθούν με μη αυτόματο τρόπο.

Η Google εξηγεί ότι για τη λειτουργία Hum to Search, χρησιμοποιεί μοντέλα μηχανικής εκμάθησης για να μετατρέψει τον ήχο σε μια "αριθμητική ακολουθία" που αντιπροσωπεύει τη μελωδία του τραγουδιού - αυτό που λέει μπορεί να θεωρηθεί ως "δαχτυλικό αποτύπωμα."

Περισσότερο φιλικό προς το χρήστη

Η χρήση της μηχανικής εκμάθησης στη λειτουργία Hum to Search της Google κάνει τελικά το εργαλείο πολύ πιο εύκολο στη χρήση στον πραγματικό κόσμο. Επειδή το Hum to Search ταιριάζει με τη μελωδία του βουητού του χρήστη με το πραγματικό τραγούδι, το εργαλείο μπορεί να συνεργαστεί με τα νέα τραγούδια καθώς κυκλοφορούν αντί για μια βάση δεδομένων που χρειάζεται διαρκώς να ενημερώνεται με βουρκωμένες εκδόσεις κάθε κομματιού. Επιπλέον, δεν χρειάζεστε τέλειο τόνο για να το χρησιμοποιήσετε.

"Το τρέχον σύστημα φθάνει σε υψηλό επίπεδο ακρίβειας σε μια βάση δεδομένων τραγουδιών που περιέχει πάνω από μισό εκατομμύριο τραγούδια τα οποία ενημερώνουμε συνεχώς", ανέφερε η Google στην ανακοίνωση Hum to Search. "Αυτό το σώμα τραγουδιού έχει ακόμα περιθώριο να αναπτυχθεί ώστε να περιλαμβάνει περισσότερες από τις πολλές μελωδίες του κόσμου."

Συνιστάται: