Tintenklekse, verunreinigungen, Überengagierte Druckerpatronen. schwer lesbare Dokumente sind für Unsere OCR API kein problem.
In unserem letzten Blogbeitrag haben wir uns mit einigen Uploadparametern unserer OCR-Engine befasst. Heute möchte ich Ihnen speziell zeigen, welche Möglichkeiten wir Ihnen bieten, wenn ihr Dokument verunreinigt ist, Sie es aber trotzdem einlesen lassen möchten.
Es ist einfach ärgerlich. Zu viel Tinte. Flüssigkeit auf dem Papier. Vielleicht wurde das Dokument auch fehlerhaft gedruckt und die für Sie so wichtigen Metadaten sind nicht mehr so einfach herauszulesen. Nehmen wir nur das Beispiel der IBAN auf einer Rechnung.
Ein undeutlicher Druck, und aus einer Acht wird gern mal eine Neun – oder doch eine Acht? In jedem Fall sitzen Sie nun hier und geben die Daten wieder per Hand ein, weil das Dokument für Maschinen nicht lesbar ist. Wir fanden, dass eine moderne Engine für optical character recognition in der Lage sein sollte, Sie auch hier zu unterstützen. Also haben wir eine gemacht.
Unsere OCR-Engine wandelt all Ihre Dokumente in ein einheitliches Format und prozessiert sie nach Ihren Vorstellungen. Und nebenbei macht sie auch noch sauber.
Die Ausgangssituation
Nicht jedes Dokument, dass Sie einlesen lassen möchten, wird in idealem Zustand eingescannt. Wo es sich bei schräg eingescannten Seiten vielleicht noch um ein kosmetisches Problem handelt, hört bei verunreinigten Dokumenten der Spaß auf.
Wir haben mit unserer OCR-Engine eine Schnittstelle entwickelt, die mit diesen Dingen umgehen kann. Wie funktioniert das jetzt genau in der Anwendung?
Es könnte kaum einfacher sein
Die Funktion ist dabei denkbar einfach: Über eine simple true/false-Zuweisung aktivieren Sie die gewünschten Parameter für den Upload Ihrer Dokumente. Sie können dabei auswählen, ob das Dokument vor dem Durchlauf durch OCR gereinigt wird, und/oder danach. Außerdem begradigen wir auf Wunsch die Horizontlinie Ihrer Seiten. In unserer API sieht das dann so aus:
Im Ergebnis erhalten Sie dann ein Dokument, dass exakt nach Ihren Vorstellungen umgewandelt wurde. Probieren Sie es doch mal aus – unser OCR-API wird Sie sicher überzeugen! Hier können Sie auch unsere Online-Version des Servers testen.
Sie möchten nochmal alle Artikel zum Thema durchsehen? Aber gern.