Rechnungserfassung: OCR, iOCR und KI

In unseren Gesprächen über Rechnungs-, Beleg- und Dokumentenerfassung mit BLU DELTA OCR Kunden kommt es immer wieder zu Begriffsverwirrungen rund um die Themen OCR, iOCR, und welche Rolle hier künstliche Intelligenz spielt. In dem folgenden Artikel wollen wir diese Begriffe, und warum ein:e Softwareentwickler:in unter OCR etwas anderes versteht wie ein Kreditorenbuchhalter oder ein Sachbearbeiter aus einer Finanzabteilung, klarstellen.

OCR, iOCR und KI

OCR (Optical Character Recognition) 

Sie kennen sicherlich den ärgerlichen Moment, wenn man aus einem PDF eines Dokuments wie Rechnungen, Belege, Lieferscheine, Bestellungen, Verträge, etc. eine wichtige (und oftmals lange) Textstelle kopieren und in eine andere Applikation zur Rechnungserfassung oder Buchungsmaske kopieren möchte – aber man kann den Text nicht markieren! Warum geht das nicht!? 

OCR: Die Sichtweise der Techniker:innen 

Zu diesem Zeitpunkt besteht die Rechnung oder der Beleg für die Maschine nur aus einzelnen Punkten (Pixeln). Dieses erste Problem kann ein OCR (Optical Character Recognition) lösen. Eine OCR erkennt zusammenhängende Bildpunkte und bildet diese auf bekannte Schriftzeichen ab. Im Allgemeinen zielt also die klassische OCR-Verarbeitung darauf ab, den vollständigen Text aus allen in einer Bilddatei (z. B. jpg, png, tiff, pdf von Rechnungen oder Belegen) erkannten Zeichen zu erkennen und als digitale Buchstaben mit Meta-Informationen wie Position auf einer Seite, Schriftgröße, Fonts, etc. digital zu erfassen.  

Eine Rechnung, ein Beleg oder ein Dokument, dass z.B. mit einem intelligenten Rechnungserfassungssystem erstellt wurde, liefert ein PDF-Text Dokument zurück, das es erlaubt den Text zu markieren (Details zu PDF).  

Mehr Details wie ein OCR funktioniert und warum sie die Basis für RPA und weitere Automatisierungen darstellt finden Sie auch in unserem Beitrag "Was ist OCR?".

OCR: Die Sichtweise der Buchhalter:innen 

Im Laufe der Zeit hat sich hier zwischen Buchhalter und Softwareentwickler eine unangenehme Verwirrung der Begrifflichkeiten entwickelt. Speziell im Rechnungswesen, Buchhaltern und Steuerberatern versteht man unter dem OCR eigentlich ein iOCR. 

iOCR vs. OCR 

 „Intelligent Optical Character Recognition (iOCR)“ kann als Kombination aus OCR und intelligenter Extraktion strukturierter Daten verstanden werden, die als Ergebnis bestimmte Informationen in Form von einzelnen Datenelementen mit semantischer Annotation bereitstellt. 

Das iOCR wandelt den „Buchstabensalat“ in semantische Informationen um. D.h. iOCR oder das intelligente OCR „versteht Dokumente“ auf Wort und Satzebene. Auf Rechnungen und Belege erkennt ein hochwertiges iOCR bereits einfache Dinge wie Rechnungsnummer, Rechnungsdatum, Netto- und Brutto-Gesamtbetrag oder Mehrwertsteuer. Bessere iOCR können dann bereits Sätze richtig interpretieren, die z.B. Skonto, Leistungszeitrum oder Steuer Codes interpretieren können. Auch das Auslesen von Adressen aus einem gescannten Textdokument - also Straße, Hausnummer, Postleitzahl und Ort – ist z.B. möglich. Tabellen, wie z.B. Positionen auf Rechnungen, Belegen, Bestellungen oder Lieferscheine, können ebenfalls erkannt und erfasst werden. 

KI schafft die Intelligenz einer iOCR oder Rechnungserfassung 

Künstliche Intelligenz lernt durch Training aus dem Buchstaben Salat von Rechnungen und Dokumenten Wörter und Zahlen zu formen und in einem weiteren Schritt den Sinn dieser Wörter in semantische Strukturen abzubilden. Also einen Indikator für eine Rechnungsnummer (z.B. BelegNr) automatisch zu erkennen und die Zahl und Buchstaben Kombination in dessen Nähe als Wert der Rechnungsnummer zu interpretieren. 

BLU DELTA ist ein Produkt für die automatisierte Erfassung von Finanzdokumenten. Partner, aber auch Finanzabteilungen, Kreditorenbuchhalter und Steuerberater unserer Kunden können mit BLU DELTA ihre Mitarbeiter bei der zeitaufwendigen und meist manuellen Erfassung von Dokumenten durch den Einsatz von BLU DELTA KI und Cloud unmittelbar entlasten.

BLU DELTA ist eine Künstliche Intelligenz der Blumatix Intelligence GmbH.

Christian Weiler

Autor: Christian Weiler ist ehemaliger General Manager eines global agierenden IT Unternehmens mit Sitz in Seattle/US. Seit 2016 ist Christian Weiler vermehrt im Bereich Künstlicher Intelligenz in verschiedensten Rollen tätig und verstärkt seit 2018 das Management Team der Blumatix Intelligence GmbH.
Kontakt: c.weiler@blumatix.com