Τι πρέπει να γνωρίζετε
- Στο Google Books Ngram Viewer, πληκτρολογήστε μια φράση, επιλέξτε ένα εύρος ημερομηνιών και σώμα, ορίστε το επίπεδο εξομάλυνσης και κάντε κλικ στο Αναζήτηση πολλών βιβλίων.
- Μπορείτε να εμβαθύνετε στα δεδομένα. Για παράδειγμα, για να αναζητήσετε τη μορφή του ρήματος του ψαριού, αντί για το ουσιαστικό fish, χρησιμοποιήστε μια ετικέτα: αναζητήστε fish_VERB.
- Το Ngram Viewer βγάζει ένα γράφημα που αντιπροσωπεύει τη χρήση της φράσης στο πέρασμα του χρόνου. Για πολλές φράσεις, κάθε μία αντιπροσωπεύεται από μια χρωματική γραμμή.
Αυτό το άρθρο εξηγεί πώς να χρησιμοποιήσετε το εργαλείο Ngram Viewer στα Βιβλία Google για τη διεξαγωγή έρευνας και ισχυρών αναζητήσεων.
Πώς λειτουργεί το Ngram Viewer
Ένα Ngram, που ονομάζεται επίσης N-gram, είναι μια στατιστική ανάλυση του περιεχομένου κειμένου ή ομιλίας για την εύρεση n (έναν αριθμό) κάποιου είδους στοιχείου στο κείμενο.
Το αντικείμενο αναζήτησης μπορεί να είναι κάθε λογής πράγματα, συμπεριλαμβανομένων φωνημάτων, προθεμάτων, φράσεων και γραμμάτων. Αν και ένα Ngram είναι σκοτεινό εκτός της ερευνητικής κοινότητας, χρησιμοποιείται σε διάφορους τομείς και έχει πολλές επιπτώσεις για προγραμματιστές που κωδικοποιούν προγράμματα υπολογιστών που κατανοούν και ανταποκρίνονται στη φυσική προφορική γλώσσα.
Στην περίπτωση του Google Books Ngram Viewer, το κείμενο που θα αναλυθεί προέρχεται από τον τεράστιο αριθμό βιβλίων στον δημόσιο τομέα που η Google σάρωνε για να συμπληρώσει τη μηχανή αναζήτησης Βιβλίων Google. Για το Google Books Ngram Viewer, η Google αναφέρεται στο σώμα του κειμένου που πρόκειται να αναζητήσετε ως το σώμα. Το Ngram Viewer συγκεντρώνει ανά γλώσσα, αν και μπορείτε να αναλύσετε ξεχωριστά τα βρετανικά και τα αμερικανικά αγγλικά ή να τα συγκεντρώσετε μαζί.
- Μεταβείτε στο Google Books Ngram Viewer στη διεύθυνση books.google.com/ngrams.
-
Πληκτρολογήστε οποιαδήποτε φράση ή φράσεις θέλετε να αναλύσετε. Διαχωρίστε κάθε φράση με κόμμα. Η Google προτείνει "Άλμπερτ Αϊνστάιν, Σέρλοκ Χολμς, Φρανκενστάιν" για να ξεκινήσετε.
Στις αναζητήσεις του NGram Viewer, τα στοιχεία κάνουν διάκριση πεζών-κεφαλαίων, σε αντίθεση με τις αναζητήσεις ιστού Google.
- Επιλέξτε ένα εύρος ημερομηνιών. Η προεπιλογή είναι 1800 έως 2000.
-
Επιλέξτε ένα σώμα. Μπορείτε να αναζητήσετε ξενόγλωσσα κείμενα ή αγγλικά κείμενα και εκτός από τις τυπικές επιλογές, μπορεί να παρατηρήσετε καταχωρήσεις όπως "Αγγλικά (2009)" ή "Αμερικάνικα Αγγλικά (2009)" στο κάτω μέρος της λίστας. Αυτά είναι παλαιότερα σώματα που η Google ενημέρωσε έκτοτε, αλλά μπορεί να έχετε κάποιο λόγο να κάνετε τις συγκρίσεις σας με παλιά σύνολα δεδομένων. Οι περισσότεροι χρήστες μπορούν να τα αγνοήσουν και να επικεντρωθούν στα πιο πρόσφατα σώματα.
- Ρυθμίστε το επίπεδο εξομάλυνσης. Η εξομάλυνση αναφέρεται στο πόσο ομαλό είναι το γράφημα στο τέλος. Η πιο ακριβής αναπαράσταση αντικατοπτρίζει ένα επίπεδο εξομάλυνσης 0, αλλά αυτή η ρύθμιση μπορεί να είναι δύσκολο να διαβαστεί. Η προεπιλογή έχει οριστεί σε 3. Στις περισσότερες περιπτώσεις, δεν χρειάζεται να το προσαρμόσετε.
- Πατήστε Αναζήτηση πολλών βιβλίων.
Χρησιμοποιώντας το Ngram Viewer της Google, μπορείτε να εμβαθύνετε στα δεδομένα. Εάν θέλετε να αναζητήσετε το ρήμα fish αντί για το ουσιαστικό fish, μπορείτε να το κάνετε χρησιμοποιώντας ετικέτες. Σε αυτήν την περίπτωση, θα αναζητούσατε fish_VERB.
Η Google παρέχει μια πλήρη λίστα εντολών άλλη προηγμένη τεκμηρίωση για χρήση με το Ngram Viewer στον ιστότοπό της.
Κατώτατη γραμμή
Το Google Books Ngram Viewer εξάγει ένα γράφημα που αντιπροσωπεύει τη χρήση μιας συγκεκριμένης φράσης σε βιβλία με την πάροδο του χρόνου. Εάν εισαγάγατε περισσότερες από μία λέξεις ή φράση, κάθε μία αντιπροσωπεύεται από μια χρωματική γραμμή σε αντίθεση με τους άλλους όρους αναζήτησης. Αυτό είναι παρόμοιο με το Google Trends, μόνο η αναζήτηση καλύπτει μεγαλύτερη περίοδο.
Μελέτη περίπτωσης
Σκεφτείτε τη μελέτη περίπτωσης των ξύδιδων. Αναφέρονται στη σειρά Laura Ingalls Wilder's Little House on the Prairie. Η εξερεύνηση με την αναζήτηση του Google στον ιστό για να μάθετε περισσότερα για τις ξιδόπιτες αποκαλύπτει ότι θεωρούνται μέρος της αμερικανικής κουζίνας του Νότου και όντως παρασκευάζονται με ξύδι. Ακούνε πίσω σε εποχές που δεν είχαν όλοι πρόσβαση σε φρέσκα προϊόντα όλες τις εποχές του χρόνου, αλλά είναι αυτή η όλη ιστορία;
Αναζητήστε το Google Ngram Viewer για ξιδόπιτα και θα συναντήσετε ορισμένες αναφορές για την πίτα στις αρχές και στα τέλη του 1800, πολλές αναφορές στη δεκαετία του 1940 και έναν αυξανόμενο αριθμό αναφορών τον τελευταίο καιρό. Ωστόσο, με επίπεδο εξομάλυνσης 3, βλέπετε ένα πλάτωμα πάνω από τις αναφορές στη δεκαετία του 1800. Επειδή δεν εκδόθηκαν πολλά βιβλία κατά τη διάρκεια αυτής της περιόδου και επειδή τα δεδομένα έχουν ρυθμιστεί να εξομαλυνθούν, η εικόνα παραμορφώνεται. Πιθανώς μόνο ένα βιβλίο ανέφερε ξύδι πίτα, και ο μέσος όρος ήταν για να αποφευχθεί μια ακίδα. Ρυθμίζοντας την εξομάλυνση στο 0, μπορείτε να δείτε ότι αυτό ακριβώς συμβαίνει. Η ακίδα επικεντρώνεται στο 1869 και υπάρχει άλλη μια αιχμή το 1897 και το 1900.
Είναι απίθανο κανείς να μην μίλησε για ξυδόπιτες την υπόλοιπη ώρα: Πιθανότατα υπήρχαν συνταγές παντού, αλλά οι άνθρωποι δεν έγραφαν για αυτές σε βιβλία, και αυτός είναι ένας σημαντικός περιορισμός των αναζητήσεων Ngram.