Hardcore: Automatisierung von PDF-Belegen

Kanal 3: PDF-Dokumente vollautomatisiert verarbeiten

DIG.easyconnect bietet als Kanal genau das, was der Name verspricht: Einen unglaublich einfachen Zugang zu vollem EDI-Komfort über das DIG Portal, damit auch diese Eingangsdokumente nie wieder per Hand eingegeben werden müssen!

Dazu werden Daten aus PDF-Dokumenten je nach konkreten Voraussetzungen mittels OCR oder Deep-OCR (verfügbar sind beide technischen Lösungen) entsprechend umgewandelt und am DIG Portal je nach Anforderungen des Kunden vollautomatisch geprüft, aufbereitet und im gewünschten Format an das Zielsystem übergeben.

Was ist OCR?

OCR steht für Optical Character Recognition, also Optische Zeichenerkennung oder gemeinhin auch Texterkennung genannt. Technisch sind nach entsprechenden Anlernphasen Erfolgsquoten bis zu 99 Prozent möglich, sodass manuelle und repetitive Aufgaben hinsichtlich Belegerfassung und Rechnungserkennung weitgehend automatisiert werden können. Neben "normalem" OCR bietet DIG auch Deep-OCR, bei dem eine künstliche Intelligenz die Anlernphasen erspart.

Automatisierte Verarbeitung von PDF-Belegen

Bestellungen z.B. über unsere eProcurement-Systeme ziehen eingehende PDF-Belege nach sich. So z.B. Auftragsbestätigungen, Rechnungen, Lieferscheine und eingehende Kundenbestellungen, die automatisiert verarbeiten werden sollen. Dafür werden diese im ersten Schritt mittels OCR in maschinenlesbaren Text umgewandelt. Die PDF-Belege werden von einer speziellen Software analysiert und die Ergebnisse auf Gültigkeit bzw. Ausleserate geprüft. Die Erfolgsquote ist dabei abhängig von Klasse, Qualität, Aufbau und Formatierung des Ursprungsdokuments.

Die ausgelesenen Daten werden über eine Umwandlung in eine XML Datei strukturiert, mit der sämtliche Vorteile eines EDI-Belegflusses genutzt werden können.

  • Auftragsbestätigungen
  • Rechnungen
  • Lieferscheine
  • eingehende Kundenbestellungen

Lieferscheinerkennung in der Praxis

Ob auf Baustellen oder in verschiedenen Lagern: Lieferscheine machen oft viel mit, bevor sie eingescannt werden! Auch stimmen auf Positionsebene die Artikelnummern des Lieferanten nicht mit den eigenen überein. DIG ermöglicht deshalb eine automatisierte Zuordnung des Lieferscheins zur Bestellung im ERP (mittels per OCR erkannter Bestellnummer). Das erleichtert nicht nur die Kontrolle, sondern ermöglicht auch ein lernendes System, das aus der manuellen Zuordnung der einzelnen Positionen die Fähigkeit ableitet, diese Artikel trotz unterschiedlicher Artikelnummer das nächste Mal automatisiert zu prüfen!

Wie OCR lernt, PDF-Belege korrekt zu lesen

Beim Standard-OCR wird die Erkennungssicherheit der Felder und Auslesung der Werte wird mit einem Punktwert gekennzeichnet. Notwendig ist dies, weil Belege unterschiedlicher Absender verschieden formatiert sind, also einzelne Felder und Positionen ganz andere Daten enthalten können. Dabei kann ein Grenzwert definiert werden, ab dem eine manuelle Validierung erfolgen soll. Dabei prüft der zuständige Mitarbeiter in einer Weboberfläche die Inhalte und führt gegebenenfalls Korrekturen durch. Auf diese Weise lernt das System laufend dazu, indem nicht erkannte Felder in der grafischen Oberfläche markiert und gespeichert werden. Als Cloud-Lösung lernt die Software aus den Eingaben aller Anwender und bietet somit allen einen schnelleren Lernfortschritt.

Einen noch schnelleren und erfolgreichen Weg eröffnet DIG mit der Integration von Deep-OCR: Bei dieser innovativen Art der Dokumenten-Analyse wird die korrekte Erfassung von Daten in Belegen mit unterschiedlichen Layouts mittels KI (künstliche Intelligenz) trainiert. So werden etwa Positionsdaten aus Eingangsrechnungen direkt an die Buchhaltungssoftware übergeben, sodass Buchungssätze direkt erstellt werden können.

DIG-Trainingsunterstützung für Standard-OCR

DIG unterstützt das OCR-Training zur Erkennung von Daten aus PDF-Rechnungen und anderen Belegen durch eine Überprüfung der einzelnen PDF-Dokumente, die keine befriedigenden Ergebnisse bringen. Im ersten Schritt werden Optimierungsmöglichkeiten durch Systemeinstellungen geprüft und vor der Durchführung besprochen. Bei Bedarf kann die Erkennungsrate auch mit individueller Programmierung soweit maximiert werden, dass im Regelfall nur noch Einzelfälle im Unternehmen validiert werden müssen.

Testen Sie das magische Auslesen Ihrer PDF-Belege!

Überzeugen Sie sich selbst, wie OCR und Deep-OCR mit genau Ihren Belegen traumhafte Resultate und vollen EDI-Komfort bringen und so nicht nur Zeit sparen, sondern auch Übertragungsfehler vermeiden! Wir erzählen Ihnen gerne mehr.

x
Wissen, was es Ihnen bringt!
Workshop sichern
Wir berechnen Ihr Potenzial.
Daten