So konvertieren Sie eine PDF-Datei mithilfe der Befehlszeile in Linux in bearbeitbaren Text
Es gibt verschiedene Gründe, warum Sie eine PDF-Datei in bearbeitbaren Text konvertieren möchten. Möglicherweise müssen Sie ein altes Dokument überarbeiten und alles, was Sie haben, ist die PDF-Version. Das Konvertieren von PDF-Dateien in Windows ist einfach, aber was ist, wenn Sie Linux verwenden?
Keine Bange. Wir zeigen Ihnen, wie Sie PDF-Dateien mit einem Befehlszeilenprogramm namens pdftotext, das Teil des Pakets "poppler-utils" ist, problemlos in bearbeitbaren Text konvertieren. Dieses Tool ist möglicherweise bereits installiert. Um zu überprüfen, ob pdftotext auf Ihrem System installiert ist, drücken Sie „Strg + Alt + T“, um ein Terminalfenster zu öffnen. Geben Sie den folgenden Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste..
dpkg -s poppler-utils
HINWEIS: Wenn wir in diesem Artikel etwas eingeben und der Text in Anführungszeichen gesetzt wird, geben Sie KEINE Anführungszeichen ein, sofern nicht anders angegeben.
Wenn pdftotext nicht installiert ist, geben Sie den folgenden Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste..
sudo apt-get install poppler-utils
Geben Sie Ihr Passwort ein, wenn Sie dazu aufgefordert werden, und drücken Sie die Eingabetaste..
Das poppler-utils-Paket enthält mehrere Tools, mit denen Sie PDF in verschiedene Formate konvertieren, PDF-Dateien bearbeiten und Informationen aus Dateien extrahieren können.
Im Folgenden finden Sie den grundlegenden Befehl zum Konvertieren einer PDF-Datei in eine bearbeitbare Textdatei. Drücken Sie "Strg + Alt + T", um ein Terminalfenster zu öffnen. Geben Sie den Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste..
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ändern Sie den Pfad zu jeder Datei, um sie dem Ort und Namen der ursprünglichen PDF-Datei sowie dem Speicherort der resultierenden Textdatei zu entsprechen. Ändern Sie auch die Dateinamen so, dass sie den Namen Ihrer Dateien entsprechen.
Die Textdatei wird erstellt und kann genauso wie andere Textdateien in Linux geöffnet werden.
Der konvertierte Text kann an Stellen, die Sie nicht möchten, Zeilenumbrüche enthalten. Zeilenumbrüche werden nach jeder Textzeile in der PDF-Datei eingefügt.
Sie können das Layout Ihres Dokuments (Kopfzeilen, Fußzeilen, Seitenwechsel usw.) von der ursprünglichen PDF-Datei in der konvertierten Textdatei beibehalten, indem Sie die Markierung „-layout“ verwenden.
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Wenn Sie nur einen Seitenbereich in einer PDF-Datei konvertieren möchten, verwenden Sie die Flags "-f" und "-l" (ein kleines "L"), um die erste und letzte Seite des zu konvertierenden Bereichs anzugeben.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Verwenden Sie zum Konvertieren einer geschützten und mit einem Besitzerkennwort verschlüsselten PDF-Datei das Kennzeichen "-opw" (das erste Zeichen in der Kennung ist ein Kleinbuchstabe "O" und keine Null)..
pdftotext -opw 'Kennwort' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ändern Sie das Kennwort in das Kennwort, das zum Schutz der konvertierten Original-PDF-Datei verwendet wird. Stellen Sie sicher, dass es einfache Anführungszeichen gibt, nicht doppelte um das "Passwort"..
Wenn die PDF-Datei mit einem Benutzerkennwort geschützt und verschlüsselt ist, verwenden Sie anstelle der Markierung "-opw" das Kennzeichen "-upw". Der Rest des Befehls ist derselbe.
Sie können auch den Typ des Zeilenendes angeben, der auf den konvertierten Text angewendet wird. Dies ist besonders hilfreich, wenn Sie auf die Datei unter einem anderen Betriebssystem wie Windows oder Mac zugreifen möchten. Verwenden Sie dazu das Flag "-eol" (das mittlere Zeichen im Flag ist ein Kleinbuchstabe "O" und keine Null), gefolgt von einem Leerzeichen und dem Typ des Zeilenendes, den Sie verwenden möchten (" Unix ”,“ Dos ”oder“ Mac ”).
HINWEIS: Wenn Sie keinen Dateinamen für die Textdatei angeben, verwendet pdftotext automatisch die Basis des PDF-Dateinamens und fügt die Erweiterung „.txt“ hinzu. Zum Beispiel wird "file.pdf" in "file.txt" konvertiert. Wenn die Textdatei als „-“ angegeben ist, wird der konvertierte Text an stdout gesendet. Dies bedeutet, dass der Text im Terminalfenster angezeigt und nicht in einer Datei gespeichert wird.
Klicken Sie zum Schließen des Terminal-Fensters auf die Schaltfläche „X“ in der oberen linken Ecke.
Um weitere Informationen zum Befehl pdftotext zu erhalten, geben Sie an der Eingabeaufforderung in einem Terminalfenster "man page pdftotext" ein.