OCR und Belegerfassung: Tipps und Tricks für bessere KI Erkennungsraten

Sie wollen erfahren, wie Sie einfach und schnell ihre optimale Automatisierungsrate in der Belegerfassung durch das BLU DELTA KI-System erreichen können? Hier haben wir einige der hilfreichsten Tipps & Tricks zusammengefasst, die ganz easy Ihren Rechnungsworkflow weiter optimieren!

Tipps und Tricks

Die Qualität ist entscheidend!

Bevor die BLU DELTA KI mit den Wörtern und Zahlenblöcken Voraussagen und Interpretationen über das Dokument treffen kann, müssen die Pixel zuerst in genau diese Buchstaben und Zahlen umgewandelt werden. Dies erledigt die OCR (Optical Character Recognition = Texterkennung).

Das OCR-System sieht sich jeden Pixel des Dokuments an, und interpretiert daraus unsere Schriftzeichen. Die BLU DELTA KI arbeitet mit Pixeln und diesen erkannten Schriftzeichen weiter, daher ist das Ergebnis unserer Belegerfassung Services stark von der eingegangenen Bildqualität abhängig.

OCR verbessern

Fotos von (Handy-)Kameras liefern beispielsweise eine viel schlechtere Grundlage für ein OCR, da hierbei der Aufnahmewinkel, Schatten und andere Faktoren nicht so optimal wie bei Scans sind.

Wir empfehlen daher, stets einen Scanner zu verwenden, und zwar mit einer eingestellten Scan-Auflösung von 300 dpi.

Optimale Voraussetzungen für die Rechnungsverarbeitung schaffen

OCR tut sich mit dunklen und farbigen Hintergründen, wie bei diesen Beispielen, besonders schwer, die Pixel einzelnen Buchstaben zuzuordnen.

OCR Beispiele Texterkennung

[In den grünen Flächen hat die Texterkennung Buchstaben erkannt. Rechts oben sieht man zwei Ausschnitte von Fotos, die dementsprechend verwackelt sind. Und rechts darunter noch ein paar Beispiele von hinterlegten Flächen bzw. eines unscharfen Scans.]

Falls Sie also eigene Ausgangsrechnungen durch den BLU DELTA Service schicken, verzichten Sie bitte auf diese Hintergründe, und verwenden stattdessen Strukturen ohne Füllung. Auch Ihren eigenen Kunden können Sie mit dieser kleinen Umgestaltung den Büroalltag wesentlich vereinfachen, sollten diese auch ein OCR System anwenden.

Das Mitgeben bekannter Werte

Aufgrund des Aufbaus einiger Dokumente könnten z.B. Absender*in und Empfänger*in in wenigen Fällen vertauscht werden. Wie Sie trotzdem stets verlässlich richtige Informationen bekommen, erfahren Sie in diesem Teil des Beitrags:

Property Store für UIDs verwenden

Wenn man einen DetectInvoiceRequest schickt, besitzt dieser unter anderem einen Property Store. Dies ist eine Struktur, in der man als Schlüssel-Wert Paar eben einen Schlüssel und den dazugehörigen Wert mitschicken kann, im Format eines Dictionary<String,String>; object

Als Receiver der Rechnung trägt man nun die ReceiverVatId ein, und somit weiß das System, dass jede weitere UID vom Sender sein muss.

Ein Beispiel könnte somit lauten:

{

    "Filter": 0,

    "Invoice": "InvoiceContentAsBase64EncodedString",

    "PropertyStore": {

        "ReceiverVatId": "DE169838187"

    },

    "CreateResultPdf": true

}

Ebenso lässt sich die UID von dem/der Absender*in mitgeben. Dies ist hilfreich, wenn Sie Ihre Ausgangsrechnungen mit BLU DELTA erfassen. Daher wissen wir ja, dass die Absender UID immer Ihre sein wird.

Auch die Sprache lässt sich mitgeben, da somit das System nicht bei jedem Buchstaben überlegen muss, wie genau der Buchstabe aussehen könnte. Besonders bei Zeichen mit Akzenten ist die mitgegebene Sprache des Dokuments für die OCR und KI eine große Erleichterung.

Detaillierte Informationen zur Nutzung der BLU DELTA API finden sie in unserer Online REST API Dokumentation unter BLU DELTA Rechnungserfassung Ressourcen.

Mit diesen Tipps schaffen Sie unserer OCR und KI die besten Grundlagen für die Verarbeitung, und vermeiden so unnötig manuell abzuarbeitende Dokumente.

Sollten Sie weitere Fragen oder Anliegen haben, steht Ihnen unser Support Team jederzeit zur Verfügung (bludelta-support@blumatix.com).

BLU DELTA ist ein Produkt für die automatisierte Erfassung von Finanzdokumenten. Partner, aber auch Finanzabteilungen, Kreditorenbuchhalter und Steuerberater unserer Kunden können mit BLU DELTA ihre Mitarbeiter bei der zeitaufwendigen und meist manuellen Erfassung von Dokumenten durch den Einsatz von BLU DELTA KI und Cloud unmittelbar entlasten.

BLU DELTA ist eine Künstliche Intelligenz der Blumatix Intelligence GmbH.

Andrea Pauritsch

Autorin: Andrea Pauritsch studierte nach ihrer Ausbildung an der Bundeshandelsakademie Hollabrunn Informationstechnik & Systemmanagement an der Fachhochschule Salzburg und arbeitete währenddessen am IT Helpdesk. Seit Jänner 2022 unterstützt sie das Team der Blumatix Intelligence GmbH in den Bereichen Customer Service, Marketing und Data Management.
Kontakt: a.pauritsch@blumatix.com