Tesseract.js bringt Bild-OCR-Übersetzung für Browser

Die OCR-Übersetzung ist immer noch nicht perfekt, hat sich jedoch in den letzten Jahren dramatisch verbessert. Wegweisend ist der Tesseract Übersetzungsmaschine derzeit offen eingespeist in C++.

Obwohl dies eine unglaubliche Bibliothek ist, ist sie auf Software beschränkt. Zum Glück hat jemand einen Tesseract-Port in JavaScript erstellt, der Tesseract.js heißt. Es unterstützt bis zu 60 Sprachen und obwohl es sicherlich nicht perfekt ist, macht es die Arbeit gut.

Installation und Setup sind ein Kinderspiel, wo Sie können ein beliebiges Bildelement anvisieren auf der Seite und führen Sie die Tesseract.recognize () Funktion. Dies kann jede Art von Bild aufnehmen und wird automatisch erstellt komprimieren und übersetzen direkt im Browser.

Sie können viel komplizierter werden, aber die Schönheit ist wie Sie OCR mit einer einzigen Codezeile ausführen können.

Schauen Sie sich die Tesseract.js-Startseite an, wenn Sie eine Live-Demo sehen möchten. Dies funktioniert direkt im Browser, wo Sie können Ziehen Sie ein beliebiges gescanntes Textbild per Drag & Drop, um eine automatische OCR-Übersetzung zu erhalten.

Sie können dieses Beispiel auch lokal über die GitHub-Seite herunterladen oder eine eigene App erstellen, indem Sie das Tesseract.js-Skript direkt aus einem CDN hinzufügen.

Das einfachste Codebeispiel sieht wie folgt aus mein Bild ist ein direkter Verweis auf ein HTML-Bildelement:

 Tesseract.recognize (myImage) .then (Funktion (Ergebnis) console.log (Ergebnis));

In jedem Fall ist diese Bibliothek so hilfreich, um OCR im Web zu nutzen. Es ist alles andere als perfekt, aber es ist auch das beste Ressource für Webentwickler, die dynamische In-Page-OCR-Funktionen wünschen.

Um mehr zu erfahren, besuchen Sie die Tesseract.js GitHub-Seite, auf der Sie eine Live-Demo ausprobieren und die Online-Dokumentation durchsuchen können.