Was ist OCR?

Eine OCR (Optical Character Recognition, Optische Zeichenerkennung oder auch Texterkennung) wandelt ein bereits digitalisiertes Bild in Textzeichen um. Ein Bild mit Wörtern wird in maschinenlesbare Zeichen (Buchstaben, Zahlen, etc.) übersetzt. Wie dies noch besser funktioniert, erfahren Sie hier: Tipps und Tricks für bessere KI Erkennungsraten

Achtung: Leider gibt es in Diskussionen zwischen Fachabteilungen oder auch mit unseren Kunden*innen hier immer wieder Missverständnisse bzgl. der Begrifflichkeit (siehe dazu die Unterscheidung OCR, iOCR und KI).

OCR – Basis für die Prozess-Automatisierung

OCR ist eine Technologie, die die Umwandlung von gescannten Papierdokumenten, PDF-Dateien oder Digitalfotos in bearbeitbare Dokumente für Computer und Software (wie Microsoft Word oder FIBU Software) ermöglicht. Selbst Einzelposten lassen sich extrahieren, nachzulesen in diesem Blog Beitrag: Einzelposten erfassen mit OCR 

Wenn Sie also ein Dokument in Papierform haben – zum Beispiel eine Rechnung, eine Bestellung oder einen Vertrag, den Ihnen jemand als PDF-Anhang geschickt hat - dann reicht ein Scanner nicht aus, um mit den relevanten Informationen aus diesen Dokumenten zu arbeiten. Der Scanner macht nur ein Bild des Dokuments und dieses besteht aus einer Ansammlung von Bildpunkten. Zur Weiterverarbeitung der Informationen aus gescannten Dokumenten, Digitalbildern oder Bild-PDFs benötigen Sie eine OCR-Software, die in den digitalen Bildern Zeichen erkennt, diese zu Wörtern und Zahlen zusammensetzt, und daraus ganze Sätze baut. Damit erstellt die Software aus einem Bild eine Zeichenkette, einen Text. Dieser Absatz der Online-Enzyklopädie Wikipedia erklärt das Verfahren auch sehr gut: Texterkennung – Wikipedia. Nun fehlt aber noch die semantische Bedeutung des Texts und der Zahlen (z.B. welche Zahl ist der Bruttogesamtbetrag), damit Sie Ihre Prozesse ohne „human in the loop“ automatisieren können.