BLU DELTA KI Lernbeschleuniger: Bounding Box

Die BLU DELTA KI lernt anhand von Trainingsdaten. In diesem Artikel erfahren Sie, wie dieser Prozess funktioniert und warum die Positionsinformation der Trainingsdaten, auch als Bounding Box bezeichnet, eine zentrale Rolle spielt. Über die Learn-API-Schnittstelle können Trainingsdaten, auch bekannt als Ground Truth, zur Verfügung gestellt werden, um die Künstliche Intelligenz zu schulen.

Bounding Box in KI-Trainingsdaten

Künstliche Intelligenz benötigt Kontext, Text und Layout-Informationen, um Dokumente zu verstehen. Der Kontext kann von externen Quellen stammen, wie der Industrie, dem Land, in dem die Rechnung ausgestellt wurde, oder direkt aus Unternehmensdaten. Text und Bilder sind entscheidend, um die Bedeutung der Informationen zu erfassen. Das Layout des Dokuments liefert implizite Informationen über die Position und Gruppierung von Texten und Bildern, einschließlich Tabellen, Listen und Textblöcken.

In den meisten Fällen benötigt eine KI all diese Informationen während des Trainingsprozesses sowie später zur Qualitätsmessung (Benchmarking). Daher ist es unerlässlich, die Positionsdaten einer Information für das Trainings an die Künstliche Intelligenz weiterzugeben.

Betrachten wir ein konkretes Beispiel:

Trainingsdaten

Wenn die KI in einem bestimmten Dokument die Bestellnummer erlernen soll, sind folgende Trainingsdaten (Ground Truth) erforderlich:

“Value”: “258934”,

“X”: 479,

“Y”: 915,

“Width”: 127,

“Height”: 30

Diese Werte definieren die sogenannte Bounding Box, also die konvexe Hülle, die die Zeichenkette am Dokument umgibt und dessen Position festlegt.

Integration der BLU DELTA Learn-API

Bedeutung der Bounding Box in KI-Trainingsdaten

Die BLU DELTA KI bietet eine eigene Schnittstelle, die Learn-API, an. Diese ermöglicht es, korrigierte Werte direkt in den KI-Trainingsprozess einzuspeisen, sei es aus einem Workflow oder einem Geschäftsprozess. Die Learn-API akzeptiert sowohl das Dokument als auch die essenziellen Dokumenteninformationen sowie deren Positionsdaten.

Es ist entscheidend, dass Positionsdaten bei der Korrektur im eigenen Prozess oder in der Oberfläche zwingend erfasst und dann an die Learn-API weitergeleitet werden. Die Oberfläche muss die Dokumente als Bilder mit einer Auflösung von 300 dpi darstellen und dem Benutzer ermöglichen, Textfelder im Dokument zu markieren.

Bei einer optimalen Integration werden dem Workflow nur die Dokumente oder Rechnungen angezeigt, bei denen die BLU DELTA KI unsicher ist. Ein Sachbearbeiter überprüft diese und korrigiert sie gegebenenfalls, indem er das betreffende Wort markiert, das dann direkt von der Learn-API übernommen wird. Im Hintergrund überträgt der Workflow diese Information direkt an die Learn-API, sodass diese Korrektur bereits im nächsten Training berücksichtigt wird.

Optional kann die Learn-API auch Werte ohne Positionsangaben akzeptieren. In solchen Fällen versucht ein intelligenter Algorithmus in Kombination mit KI, die Ground Truth (also die zugehörigen Positionsdaten zu den Werten) zu ermitteln. Dies ist jedoch nicht immer erfolgreich. Sollte dies nicht gelingen, muss ein BLU DELTA Data Labeler die fehlenden Informationen manuell ergänzen, wodurch das System langsamer lernt.

Natürlich kann die Learn-API auch nur die Dokumente übernehmen. In diesem Fall müssen alle Trainingsdaten manuell überprüft werden. Die Informationen werden nach Relevanz (Clustergröße, Active Learning) priorisiert und vom Kunden oder einem BLU DELTA Data Labeler manuell erfasst, bevor sie in das Training einfließen.

Weitere technische Details zur BLU DELTA Learn-API finden Sie auf www.bludelta.dev.

Wenn Sie mehr über die Datenerfasssung mit BLU DELTA KI erfahren möchten, freuen wir uns über Ihre Kontaktaufnahme.

BLU DELTA ist ein Produkt für die automatisierte Erfassung von Finanzdokumenten. Partner, aber auch Finanzabteilungen, Kreditorenbuchhalter und Steuerberater unserer Kunden können mit BLU DELTA ihre Mitarbeiter bei der zeitaufwendigen und meist manuellen Erfassung von Dokumenten durch den Einsatz von BLU DELTA KI und Cloud unmittelbar entlasten.

BLU DELTA ist eine Künstliche Intelligenz der Blumatix Intelligence GmbH.

Christian Weiler

Autor: Christian Weiler ist ehemaliger General Manager eines global agierenden IT Unternehmens mit Sitz in Seattle/US. Seit 2016 ist Christian Weiler vermehrt im Bereich Künstlicher Intelligenz in verschiedensten Rollen tätig und verstärkt seit 2018 das Management Team der Blumatix Intelligence GmbH.
Kontakt: c.weiler@blumatix.com