Was ist optische Zeichenerkennung (OCR)?

Optical Character Recognition (OCR) bezieht sich auf Software, die eine digitale Version eines gedruckten, typisierten oder handgeschriebenen Dokuments erstellt, das Computer lesen können, ohne dass der Text manuell eingegeben oder eingegeben werden muss. OCR wird im Allgemeinen für gescannte Dokumente im PDF-Format verwendet, kann jedoch auch eine computerlesbare Textversion in einer Bilddatei erstellen.

Was ist OCR?

OCR, auch Texterkennung genannt, ist eine Softwaretechnologie, die Zeichen wie Zahlen, Buchstaben und Satzzeichen (auch Glyphen genannt) aus gedruckten oder schriftlichen Dokumenten in ein elektronisches Formular umwandelt, das von Computern und anderen Softwareprogrammen leichter erkannt und gelesen werden kann. Einige OCR-Programme machen dies, während ein Dokument mit einer Digitalkamera gescannt oder fotografiert wird. Andere können diesen Vorgang auf Dokumente anwenden, die zuvor ohne OCR gescannt oder fotografiert wurden. Mit OCR können Benutzer in PDF-Dokumenten suchen, Text bearbeiten und Dokumente neu formatieren.

Wofür wird OCR verwendet?

Für schnelle, alltägliche Scananforderungen ist OCR keine große Sache. Wenn Sie sehr viel scannen, kann die Suche in PDF-Dateien nach dem gewünschten Dokument viel Zeit sparen und die OCR-Funktion in Ihrem Scannerprogramm wichtiger machen. Hier sind einige andere Dinge, mit denen OCR hilft:

Automatisierte Datenverarbeitung und Dateneingabe (Beispiel: Verfolgungssysteme für Bewerber für Lebensläufe)
Gescannte Bücher durchsuchbar machen
Konvertieren von handschriftlichen Scans in computerlesbaren Text
Dokumente für Benutzer lesbarer machen, die Sehbehinderte unterstützen
Historische Dokumente und Zeitungen bleiben erhalten, aber auch durchsuchbar
Datenextraktion und Übernahme in Buchhaltungsprogramme (Beispiel: Quittungen und Rechnungen)
Indizieren von Dokumenten zur Verwendung durch Suchmaschinen
Erkennung von Führerscheinen durch Radar- und Rotlichtkamerasoftware
Sprachsynthesizer für Menschen, die nicht sprechen können - der theoretische Physiker Stephen Hawking ist vielleicht der bekannteste Benutzer eines Sprachsynthesizerprogramms

Warum OCR verwenden?

Warum machst du nicht einfach ein Foto? Weil Sie nichts bearbeiten oder den Text durchsuchen können, weil es sich nur um ein Bild handelt. Durch das Scannen des Dokuments und die Ausführung der OCR-Software kann aus dieser Datei etwas werden, das Sie bearbeiten und durchsuchen können.

Geschichte der OCR

Während die früheste Verwendung der Texterkennung bereits im Jahr 1914 erfolgte, begann die weit verbreitete Entwicklung und Verwendung von OCR-bezogenen Technologien in den 1950er Jahren, insbesondere mit der Schaffung von stark vereinfachten Schriften, die sich leichter in digital lesbaren Text umwandeln ließen. Die erste dieser vereinfachten Schriftarten wurde von David Shepard entwickelt und ist allgemein als OCR-7B bekannt. OCR-7B wird noch heute in der Finanzbranche für die Standardschriftart verwendet, die auf Kreditkarten und Debitkarten verwendet wird. In den 1960er Jahren verwendeten Postdienste in mehreren Ländern die OCR-Technologie, um die Sortierung von Postsendungen erheblich zu beschleunigen, darunter die Vereinigten Staaten, Großbritannien, Kanada und Deutschland. OCR ist nach wie vor die Kerntechnologie, mit der Post für Postdienste auf der ganzen Welt sortiert wird. Im Jahr 2000 wurde das Schlüsselwissen über die Grenzen und Fähigkeiten der OCR-Technologie zur Entwicklung der CAPTCHA-Programme zum Anhalten von Bots und Spammern verwendet.

Im Laufe der Jahrzehnte ist OCR aufgrund von Fortschritten in verwandten Technologiebereichen wie künstlicher Intelligenz, maschinellem Lernen und Computervision immer genauer und komplexer geworden. Heutzutage verwendet die OCR-Software Mustererkennung, Featureerkennung und Text Mining, um Dokumente schneller und genauer als je zuvor zu transformieren.