Quelle: Bild: Shutterstock / pling
Texterkennung mit Vision 11.02.2020, 07:50 Uhr

Textform

Vision und VisionKit machen Texterkennung spielend einfach.
Das Vision-Framework wurde 2017 zusammen mit Core ML vorgestellt und ist Apples Tool-Sammlung, bei der neuronale Netze im Bereich Computer Vision zum Einsatz kommen. Die Sammlung ist umfangreich, doch beim Thema Texterkennung ließ sie noch zu wünschen übrig. Mit dem VNDetectTextRectanglesRequest wurde zwar die Position von Texten erkannt, die Erkennung der Textinhalte musste man allerdings selber machen. Neu mit iOS 13 gibt es in der dritten Iteration von Vision nun mit VNRecognizeTextRequest eine Lösung zur Texterkennung.
Ebenfalls neu ist VisionKit. Dieses Framework enthält den hoch gelobten Dokumenten-Scanner der Notizen-App, der nun als eigenständige Komponente zur direkten Nutzung zur Verfügung steht. Sie unterstützt den Nutzer beim Fotografieren von Dokumenten, indem es die Rechteck-Erkennung von Vision verwendet, um Dokumente live in der Vorschau zu erkennen (Bild 1). Einmal erkannt, werden diese dann ausgeschnitten, optimiert und die Perspektive korrigiert. Das Ergebnis erreicht zwar nicht die Qualität eines Flachbettscanners, doch ist es in der Regel gut genug. Wobei das iPhone den Vorteil hat, dass man es jederzeit dabei hat. Beide Lösungen lassen sich hervorragend kombinieren, wobei die mit dem Dokumenten-Scanner gefertigten Aufnahmen gleich zur Texterkennung an Vision weitergegeben werden können.

web & mobile DEVELOPER

Sie wollen zukünftig auch von den Vorteilen eines plus-Abos profitieren? Werden Sie jetzt web&mobile Developer plus Kunde.
  • 2 Monate Gratis testen
  • Über 4.000 qualifizierte Fachartikel
  • Diverse DevBooks thematisch für Sie zusammen gestellt
  • Webcasts von 30 - 90 Min.
  • Aufzeichnungen von ausgewählten Fortbildungen und Konferenzen
  • Auf jedem Gerät verfügbar