Τι είναι η οπτική αναγνώριση χαρακτήρων (OCR);

Πίνακας περιεχομένων:

Τι είναι η οπτική αναγνώριση χαρακτήρων (OCR);
Τι είναι η οπτική αναγνώριση χαρακτήρων (OCR);
Anonim

Η Οπτική αναγνώριση χαρακτήρων (OCR) αναφέρεται σε λογισμικό που δημιουργεί μια ψηφιακή έκδοση ενός έντυπου, δακτυλογραφημένου ή χειρόγραφου εγγράφου που οι υπολογιστές μπορούν να διαβάσουν χωρίς να απαιτείται η μη αυτόματη πληκτρολόγηση ή εισαγωγή του κειμένου. Το OCR χρησιμοποιείται γενικά σε σαρωμένα έγγραφα σε μορφή PDF, αλλά μπορεί επίσης να δημιουργήσει μια αναγνώσιμη από υπολογιστή έκδοση κειμένου μέσα σε ένα αρχείο εικόνας.

Τι είναι το OCR

Το OCR, που αναφέρεται επίσης και ως αναγνώριση κειμένου, είναι τεχνολογία λογισμικού που μετατρέπει χαρακτήρες όπως αριθμούς, γράμματα και σημεία στίξης (ονομάζονται επίσης γλυφές) από έντυπα ή γραπτά έγγραφα σε ηλεκτρονική μορφή που αναγνωρίζονται και διαβάζονται πιο εύκολα από υπολογιστές και άλλα προγράμματα λογισμικού. Ορισμένα προγράμματα OCR το κάνουν αυτό καθώς ένα έγγραφο σαρώνεται ή φωτογραφίζεται με ψηφιακή κάμερα και άλλα μπορούν να εφαρμόσουν αυτήν τη διαδικασία σε έγγραφα που έχουν σαρωθεί ή φωτογραφηθεί προηγουμένως χωρίς OCR. Το OCR επιτρέπει στους χρήστες να πραγματοποιούν αναζήτηση σε έγγραφα PDF, να επεξεργάζονται κείμενο και να μορφοποιούν εκ νέου έγγραφα.

Image
Image
Σάρωση ιστορικής εφημερίδας με λογισμικό OCR.

Getty Images

Γιατί χρησιμοποιείται το OCR;

Για γρήγορες, καθημερινές ανάγκες σάρωσης, η OCR μπορεί να μην είναι μεγάλη υπόθεση. Εάν κάνετε μεγάλη ποσότητα σάρωσης, η δυνατότητα αναζήτησης σε αρχεία PDF για να βρείτε το ακριβές που χρειάζεστε μπορεί να εξοικονομήσει αρκετό χρόνο και να κάνει τη λειτουργικότητα OCR στο πρόγραμμα σαρωτή σας πιο σημαντική. Ακολουθούν μερικά άλλα πράγματα στα οποία βοηθά το OCR:

  • Αυτοματοποιημένη επεξεργασία δεδομένων και εισαγωγή δεδομένων (Παράδειγμα: Συστήματα παρακολούθησης αιτούντων εργασία για βιογραφικά).
  • Κάνοντας τα σαρωμένα βιβλία με δυνατότητα αναζήτησης.
  • Μετατροπή χειρόγραφων σαρώσεων σε κείμενο αναγνώσιμο από υπολογιστή.
  • Κάνοντας τα έγγραφα πιο χρηστικά από προγράμματα ανάγνωσης που βοηθούν χρήστες με προβλήματα όρασης.
  • Διατήρηση ιστορικών εγγράφων και εφημερίδων, ενώ παράλληλα καθίσταται δυνατή η αναζήτησή τους.
  • Εξαγωγή και μεταφορά δεδομένων σε λογιστικά προγράμματα (Παράδειγμα: Αποδείξεις και τιμολόγια).
  • Δημιουργία ευρετηρίου εγγράφων για χρήση από μηχανές αναζήτησης.
  • Αναγνώριση πινακίδων κυκλοφορίας οδηγού από κάμερα ταχύτητας και λογισμικό κάμερας με κόκκινο φως.
  • Συνθεσάιζερ ομιλίας για άτομα που δεν μπορούν να μιλήσουν – ο θεωρητικός φυσικός, Stephen Hawking, είναι ίσως ο πιο γνωστός χρήστης ενός προγράμματος σύνθεσης ομιλίας.

Κατώτατη γραμμή

Γιατί να μην τραβήξετε απλώς μια φωτογραφία, σωστά; Επειδή δεν θα μπορούσατε να επεξεργαστείτε τίποτα ή να κάνετε αναζήτηση στο κείμενο επειδή θα ήταν απλώς μια εικόνα. Η σάρωση του εγγράφου και η εκτέλεση λογισμικού OCR μπορούν να μετατρέψουν αυτό το αρχείο σε κάτι που μπορείτε να επεξεργαστείτε και να μπορείτε να αναζητήσετε.

Ιστορικό OCR

Ενώ η πιο πρώιμη χρήση της αναγνώρισης κειμένου χρονολογείται από το 1914, η ευρεία ανάπτυξη και χρήση τεχνολογιών που σχετίζονται με το OCR ξεκίνησε σοβαρά τη δεκαετία του 1950, ειδικά με τη δημιουργία πολύ απλοποιημένων γραμματοσειρών που ήταν πιο εύκολο να μετατραπούν σε ψηφιακά ευανάγνωστο κείμενο. Η πρώτη από αυτές τις απλοποιημένες γραμματοσειρές δημιουργήθηκε από τον David Shepard και είναι κοινώς γνωστή ως OCR-7B. Το OCR-7B εξακολουθεί να χρησιμοποιείται σήμερα στον χρηματοπιστωτικό κλάδο για την τυπική γραμματοσειρά που χρησιμοποιείται σε πιστωτικές και χρεωστικές κάρτες. Στη δεκαετία του 1960, οι ταχυδρομικές υπηρεσίες σε πολλές χώρες άρχισαν να χρησιμοποιούν την τεχνολογία OCR για να επιταχύνουν σημαντικά τη διαλογή αλληλογραφίας, συμπεριλαμβανομένων των Ηνωμένων Πολιτειών, της Μεγάλης Βρετανίας, του Καναδά και της Γερμανίας. Το OCR εξακολουθεί να είναι η βασική τεχνολογία που χρησιμοποιείται για την ταξινόμηση αλληλογραφίας για ταχυδρομικές υπηρεσίες σε όλο τον κόσμο. Το 2000, βασικές γνώσεις σχετικά με τα όρια και τις δυνατότητες της τεχνολογίας OCR χρησιμοποιήθηκαν για την ανάπτυξη των προγραμμάτων CAPTCHA που χρησιμοποιούνται για να σταματήσουν τα ρομπότ και οι αποστολείς ανεπιθύμητης αλληλογραφίας.

Με τις δεκαετίες, το OCR έχει γίνει πιο ακριβές και πιο εξελιγμένο λόγω των εξελίξεων σε σχετικούς τεχνολογικούς τομείς όπως η τεχνητή νοημοσύνη, η μηχανική μάθηση και η όραση υπολογιστών. Σήμερα, το λογισμικό OCR χρησιμοποιεί αναγνώριση μοτίβων, ανίχνευση χαρακτηριστικών και εξόρυξη κειμένου για να μεταμορφώσει έγγραφα πιο γρήγορα και με μεγαλύτερη ακρίβεια από ποτέ.

Συχνές Ερωτήσεις

    Πώς σαρώνω έγγραφα με το τηλέφωνο ή το tablet μου;

    Σε iOS, ανοίξτε την εφαρμογή Notes και δημιουργήστε μια νέα σημείωση. Ανοίξτε την κάμερα και, στη συνέχεια, πατήστε Σάρωση εγγράφων. Στο Android, ανοίξτε το Google Drive και επιλέξτε το Plus (+) και μετά πατήστε Σάρωση για να σαρώσετε το έγγραφο με το τηλέφωνό σας.

    Πώς μπορώ να χρησιμοποιήσω το OCR στο Adobe Acrobat;

    Ανοίξτε ένα αρχείο PDF που περιέχει μια σαρωμένη εικόνα και, στη συνέχεια, επιλέξτε Tools > Επεξεργασία PDF. Το Acrobat θα εφαρμόσει αυτόματα το OCR, ώστε να μπορείτε να επεξεργαστείτε το κείμενο. Απλώς επιλέξτε πού θέλετε να κάνετε αλλαγές και ξεκινήστε να πληκτρολογείτε.

    Ποια είναι η διαφορά μεταξύ OCR και OMR;

    Το Optical Mark Recognition (OMR) είναι λογισμικό που ανιχνεύει σημάδια σε χαρτί, συνήθως σε φύλλο με φυσαλίδες. Το OMR χρησιμοποιείται για την επεξεργασία των αποτελεσμάτων των εξετάσεων, των ερευνών, των ερωτηματολογίων, ακόμη και των εκλογών. Σε αντίθεση με το OCR, το OMR δεν μπορεί να αποκρυπτογραφήσει τα σημάδια στη σελίδα, αλλά μόνο επαληθεύει ότι τα σημάδια υπάρχουν.

Συνιστάται: