So extrahieren und speichern Sie Bilder aus einer PDF-Datei unter Linux
Sie können PDF-Dateien unter Verwendung des Befehlszeilentools „pdftotext“ problemlos in bearbeitbaren Text konvertieren. Wenn sich jedoch Bilder in der ursprünglichen PDF-Datei befinden, werden diese nicht extrahiert. Um Bilder aus einer PDF-Datei zu extrahieren, können Sie ein anderes Befehlszeilenprogramm namens "pdfimages" verwenden..
HINWEIS: Wenn wir in diesem Artikel etwas eingeben und der Text in Anführungszeichen gesetzt wird, geben Sie KEINE Anführungszeichen ein, sofern nicht anders angegeben.
Das „pdfimages“ -Tool ist Teil des Pakets poppler-utils. Sie können überprüfen, ob es auf Ihrem System installiert ist, und es gegebenenfalls mithilfe der in diesem Artikel beschriebenen Schritte installieren.
Um Bilder aus einer PDF-Datei mit pdfimages zu extrahieren, drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen. Geben Sie den folgenden Befehl an der Eingabeaufforderung ein.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
HINWEIS: Ersetzen Sie für alle in diesem Artikel aufgeführten Befehle den ersten Pfad im Befehl und den PDF-Dateinamen durch den Pfad und den Dateinamen Ihrer ursprünglichen PDF-Datei. Der zweite Pfad sollte der Pfad zum Stammordner sein, in dem Sie die extrahierten Bilder speichern möchten. Das Wort "image" am Ende des zweiten Pfads steht für das, was Sie dem Dateinamen voranstellen möchten. Die Dateinamen der Bilder werden automatisch nummeriert (000, 001, 002, 003 usw.). Wenn Sie Text am Anfang jedes Bildes einfügen möchten, geben Sie diesen Text am Ende des zweiten Pfads ein. In unserem Beispiel beginnt jeder Dateiname mit "image", z. B. "image-001.ppm", "image-002.ppm" usw. Ein Bindestrich wird zwischen dem von Ihnen angegebenen Text und der Nummer eingefügt.
Das Standardbildformat ist PPM (Portable Pixmap) für nicht monochrome Bilder oder PBM (Portable Bitmap) für monochrome Bilder. Diese Formate können problemlos zwischen Plattformen ausgetauscht werden.
HINWEIS: Für jedes Bild in Ihrer PDF-Datei erhalten Sie möglicherweise zwei Bilddateien. Das zweite Bild für jedes Bild ist leer. Sie können also anhand der Miniaturansicht der Datei im Dateimanager feststellen, welche Bilder die Bilder aus der Datei enthalten.
Um JPG-Bilddateien zu erstellen, fügen Sie dem Befehl die Option "-j" hinzu (siehe unten).
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
HINWEIS: Sie können die Standardausgabe auch mit der Option „-png“ oder mit der Option „-tiff“ in TIFF ändern.
Die Hauptbilddatei für jedes Bild wird als JPG-Datei gespeichert. Das zweite leere Bild ist immer noch eine .ppm- oder .pbm-Datei.
Wenn Sie nur Bilder auf und nach einer bestimmten Seite konvertieren möchten, verwenden Sie die Option "-f" mit einer Nummer, um die erste zu konvertierende Seite anzugeben, wie im folgenden Beispielbefehl gezeigt.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
HINWEIS: Wir haben die Option "-j" mit der Option "-f" kombiniert, sodass wir .jpg-Bilder erhalten, und dasselbe mit der Option "-l", die weiter unten erwähnt wird.
Um alle Bilder vor und auf einer bestimmten Seite zu konvertieren, verwenden Sie die Option "-l" (ein Kleinbuchstabe "L", nicht die Zahl "1") und eine Zahl, die die letzte zu konvertierende Seite angibt (siehe unten).
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
HINWEIS: Sie können die Optionen „-f“ und „-l“ zusammen verwenden, um Bilder in einem bestimmten Seitenbereich in der Mitte Ihres Dokuments zu konvertieren.
Wenn die PDF-Datei ein Besitzerkennwort enthält, verwenden Sie die Option „-opw“ und das Kennwort in einfachen Anführungszeichen (siehe unten). Wenn das Kennwort für die PDF-Datei ein Benutzerkennwort ist, verwenden Sie anstelle des Kennworts die Option "-upw".
ANMERKUNG: Stellen Sie sicher, dass Ihr Befehl im Kommando einfache Anführungszeichen enthält.
pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumente / ExtrahierteBilder / image
Um weitere Informationen zur Verwendung des Befehls pdfimages zu erhalten, geben Sie an der Eingabeaufforderung in einem Terminalfenster "pdfimages" ein und drücken Sie die Eingabetaste. Die Befehlsverwendung wird mit einer Liste von Optionen angezeigt, die im Befehl verwendet werden können.