Startseite » Toolkit » So extrahieren Sie Text aus Bildern mithilfe der Befehlszeile

    So extrahieren Sie Text aus Bildern mithilfe der Befehlszeile

    Es ist leicht genug, ein Bild zu lesen und den Text selbst zu ziehen. Aber Text dynamisch ziehen von einem Foto ist es ein bisschen härter und zum Glück, imgclip bietet eine ziemlich einfache Lösung.

    Diese Befehlszeilenprogramm läuft im Terminal für Mac, Windows und Linux. Es wird dann einfach ein Argument für die Bilddatei zusammen mit der Sprache verwendet gibt den Text zurück in die Zwischenablage kopiert.

    Sie können die gesamte Bibliothek über npm installieren und es ist ein ziemlich einfach zu installieren. Die Sache ist nur wenige KB groß und es kommt mit einer JS-Datei, die Sie auf GitHub durchsuchen können.

    Imgclip verwendet die Tesseract.js Bibliothek zur Automatisierung der Bildverarbeitung und zum Ziehen von Text über OCR. Es ist eine der leistungsfähigsten OCR-Bibliotheken, die es bisher gab, und ist wie imgclip vollständig Open Source.

    Ich glaube, ich bin am meisten beeindruckt von der Qualität und Geschwindigkeit dieses Tools. Es funktioniert wirklich zu ziehen Sie genauen Text und es ist eines der einfachsten Werkzeuge.

    Der Befehl imgclip sollte sein direkt im Terminal laufen, gefolgt vom relativen Pfad zum Bild. Sie können auch hinzufügen vier Optionen auf das Ende, um die Ausgabe anzupassen.

    1. -h, --Hilfe: gibt Nutzungsinformationen aus
    2. -V, --Ausführung: gibt die Versionsnummer aus
    3. -l, --lang: gibt die Sprache des Textes im Bild aus
    4. -p, --drucken: druckt den Text im Bild aus (anstatt in die Zwischenablage zu kopieren)

    Zum Zeitpunkt dieses Schreibens, Tesseract unterstützt 65 Sprachen mit mehr auf dem Weg. Der Code, an den Sie anhängen --lang Tag sollte der Code sein, der in diesen Tesseract-Dateien verwendet wird.

    Zum Beispiel, -leu sucht das Bild nach englischer Text, während -ich jpn wird suchen Japanischer Text und du kannst sogar laufen -Ich jpn_vert suchen nach vertikal orientierter japanischer Text.

    Da imgclip stark auf Tesseract angewiesen ist, steht Ihnen grundsätzlich die gesamte Bibliothek zur Verfügung.

    Zu loslegen, Besuchen Sie die GitHub-Seite und laden Sie eine Kopie lokal herunter, oder installieren Sie sie über npm in einem bestimmten Verzeichnis. Dann können Sie das Tool im Terminal wie eine Anwendung ausführen Analysieren Sie ein beliebiges Bild.

    Sehen Imgclip in Aktion, Schauen Sie sich dieses kurze Video an, das als imgclip-Demo erstellt wurde.