Dokumentenklassifizierung: automatisch & sofort

In vielen Unternehmen und öffentlichen Behörden wurde früher die Dokumentenklassifizierung der eingehenden Dokumente von der Posteingangstelle, der Verwaltung oder dem Sekretariat übernommen. Die Dokumente wurden initial betrachtet und entsprechend weitergeleitet. Diese Geschäftsdokumente reichten von Rechnungen, Belegen, Steuerbescheide, etc. bis hin zu Verträgen. Jedes dieser Dokumente musste an die verantwortliche Abteilung weitergeleitet werden. Schließlich wurden sie manuell bearbeitet und landeten richtig eingeordnet(?) in einem großen Archiv.

Dokumente mit KI automatisch klassifizieren

Digitalisierung ist der Erste Schritt zur Klassifikation

Viele Unternehmen haben in den letzten zehn Jahren ihre Systeme digitalisiert und der Umfang der eingehenden Papierdokumente wird von Jahr zu Jahr geringer. Viele Organisationen haben bereits auf digitale Poststellen, Aktenverwaltungssysteme und Archive umgestellt und erhalten die meisten Dokumente per E-Mail. Einige arbeiten mit großen Scannern, um den verbleibenden Teil des Prozesses zu digitalisieren.

In vielen Unternehmen wurden diese Dokumente jedoch oftmals nur digitalisiert. Eine Klassifikation des Dokument-Typs oder weiterer Meta-Informationen blieb jedoch aus. Auch die Erstellung eines durchsuchbaren Text-Layers für jedes Dokument wurde nicht immer durchgeführt – und dabei reden wir noch nicht von dem eigentlichen Wertvollsten: der Extraktion der Informationen aus den Dokumenten.

Der Eingang und die Konvertierung von Dokumenten in ein digitales Format ist immer nur ein erster Schritt zur Reduzierung von Fehlerquellen und zur Steigerung der Betriebseffizienz. Die Klassifizierung, das Sortieren und Weiterleiten von Dokumenten an die richtige Abteilung und die Gewährleistung, dass die Dokumente in durchsuchbarem Text vorliegen, sind wertvolle nächste Schritte. Mit einem intelligenten OCR & Künstlicher Intelligenz, die beginnt Dokumente zu verstehen, können diese Schritte vollautomatisiert werden und als Teil des Dokumenteingang- und Verarbeitungsprozess einfach integriert werden.

Hier zeigen wir Ihnen, wie Sie dies mit unserer Lösung zur Dokumentenklassifizierung umsetzen können.

Transformer KI macht Dokumentenklassifizierung einfach

Vortrainierte Modelle basierend auf Transformer Architekturen wie sie auch von ChatGPT verwendet werden, helfen bei der automatisierten Klassifikation. Handelt es sich um Standarddokumente wie: Rechnungen, Belege, Lieferscheine, Transportdokumente, Ausfuhrbegleitdokumente, Zahlungsavis, Steuerbelege, etc. so kann z.B. unser BLU DELTA Classyfier den Dokumenten Typ anhand eines Screenshots, Bilds oder PDF sofort identifizieren – ohne Antrainieren!  

Das KI-Modell analysiert dabei den Text in dem Bild, die Struktur bis hinunter zu den einzelnen Pixeln und ordnet anhand dieser Informationen das Dokument einem allgemeinen Dokumenten Typ zu. Die künstliche Intelligenz hat dabei bereits von vielen vorhergehenden Trainingsepochen und Beispielen diese Typen bereits in mehreren Sprachen gelernt und kann dies auf neue Dokument sofort anwenden.

Transformer KI macht Dokumentenklassifizierung einfach

Mit der automatischen Klassifizierung von Dokumenten kann eine Genauigkeit von mehr als 99 % erreicht werden, wobei ein einzelner Sortiervorgang automatisch und 24x7 erfolgt. Die menschliche Fehlerrate liegt hier zwischen 2-7%. Die Fehler führen auch dazu, dass die falschen Prozesse getriggert werden und die Unternehmen für diese Fälle oftmals keine Routine haben. Fehler in diesem Bereich sind oftmals mit erhöhten Kosten verbunden.

Dokumentenklassifizierungen: Ready2Use oder spezielles Training?

Es gibt allgemeingültige Geschäftsdokumente (z.B. die Rechnung, Lieferschein, Fahrzeugzulassungen, etc.), branchenspezifische Dokumente (z.B. Transportdokumente in der Logistik) und kundenspezifische Dokumente.

Der BLU DELTA Classyfier bietet hier unterschiedliche Ansätze. Es gibt vortrainierte Modelle, die für allgemeingültige Dokumente sofort einsetzbar sind und kein Training für einen speziellen Use Case benötigen.

Weiters gibt es auch für spezielle Branchen (Logistik, Bau, etc.) bereits vortrainierte Modelle. Bei Dokumentenklassen, die nur in dem Firmenkontext bekannt sind, benötigt man dann in den meisten Fällen auch ein Training.

BLU DELTA Classyfier bietet hier die Möglichkeit beliebige Dokumenttypen zu trainieren. Über unsere Learn Schnittstellen können Sie ihre beliebigen Trainingsbeispiele hochladen und das Training wird automatisiert für Sie durchgeführt und ihre Klassifikation verbessert. Dies kann nach einem initialen Setup jederzeit erfolgen und ihr System wird mit jedem Trainingssatz etwas besser. So können Sie auch selbst auf die Qualität Einfluss nehmen.

Kombiniert mit der BLU DELTA Capture API können viele weitere Use Cases zur Klassifizierung abgedeckt werden:

Die Klassifizierung von Dokumenten ist ein Schlüssel für die Automatisierung. Viele Standard-Dokumente können heutzutage bereits ohne Training sofort klassifiziert werden. Sollte dies nicht ausreichend sein, so kann man moderne KI-Systeme vollautomatisiert verbessern.

Wenn Sie Interesse an unserem BLU DELTA Classyfier oder weitere Fragen zur Klassifizierung von Dokumenten haben, dann helfen wir Ihnen hier gerne.

BLU DELTA ist ein Produkt für die automatisierte Erfassung von Finanzdokumenten. Partner, aber auch Finanzabteilungen, Kreditorenbuchhalter und Steuerberater unserer Kunden können mit BLU DELTA ihre Mitarbeiter bei der zeitaufwendigen und meist manuellen Erfassung von Dokumenten durch den Einsatz von BLU DELTA KI und Cloud unmittelbar entlasten.

BLU DELTA ist eine Künstliche Intelligenz der Blumatix Intelligence GmbH.

Christian Weiler

Autor: Christian Weiler ist ehemaliger General Manager eines global agierenden IT Unternehmens mit Sitz in Seattle/US. Seit 2016 ist Christian Weiler vermehrt im Bereich Künstlicher Intelligenz in verschiedensten Rollen tätig und verstärkt seit 2018 das Management Team der Blumatix Intelligence GmbH.
Kontakt: c.weiler@blumatix.com