Extrahieren von Bildern, Text und eingebetteten Dateien aus Word-, Excel- und PowerPoint-Dokumenten
Angenommen, jemand hat Ihnen ein Word-Dokument mit vielen Bildern gesendet, und Sie möchten, dass Sie diese Bilder auf Ihrer Festplatte speichern. Sie können Bilder mit einem einfachen Trick aus einem Microsoft Office-Dokument extrahieren.
Wenn Sie eine Word- (.docx) -, Excel- (.xlsx) - oder PowerPoint-Datei (.pptx) mit eingebetteten Bildern oder anderen Dateien haben, können Sie sie (sowie den Text des Dokuments) extrahieren, ohne sie einzeln speichern zu müssen . Und das Beste: Sie benötigen keine zusätzliche Software. Die Office-XML-basierten Dateiformate docx, xlsx und pptx sind komprimierte Archive, die Sie wie jede normale ZIP-Datei mit Windows öffnen können. Von dort können Sie Bilder, Text und andere eingebettete Dateien extrahieren. Sie können die integrierte ZIP-Unterstützung von Windows oder eine App wie 7-Zip verwenden, wenn Sie dies vorziehen.
Wenn Sie Dateien aus einem älteren Office-Dokument extrahieren müssen, z. B. einer .doc-, .xls- oder .ppt-Datei, können Sie dies mit einer kleinen kostenlosen Software tun. Wir werden diesen Prozess am Ende dieses Leitfadens detailliert beschreiben.
Extrahieren des Inhalts einer neueren Office-Datei (DOCX, XLSX oder PPTX)
Um auf die inneren Inhalte eines XML-basierten Office-Dokuments zuzugreifen, öffnen Sie den Datei-Explorer (oder Windows Explorer in Windows 7), navigieren Sie zu der Datei, aus der Sie den Inhalt extrahieren möchten, und wählen Sie die Datei aus.
Drücken Sie „F2“, um die Datei umzubenennen und die Erweiterung (.docx, .xlsx oder .pptx) in „.zip“ zu ändern. Lassen Sie den Hauptteil des Dateinamens in Ruhe. Drücken Sie die Eingabetaste, wenn Sie fertig sind.
Im folgenden Dialogfeld werden Sie gewarnt, wenn Sie die Dateinamenerweiterung ändern möchten. Klicken Sie auf "Ja"..
Windows erkennt die Datei automatisch als gezippte Datei. Um den Inhalt der Datei zu extrahieren, klicken Sie mit der rechten Maustaste auf die Datei und wählen Sie im Popup-Menü die Option „Alle extrahieren“.
Im Dialogfeld "Ziel auswählen und Dateien extrahieren" wird der Pfad, in den der Inhalt der ZIP-Datei extrahiert wird, im Bearbeitungsfeld "Dateien werden in diesen Ordner extrahiert" angezeigt. Standardmäßig wird ein Ordner mit demselben Namen wie der Dateiname (ohne Dateierweiterung) in demselben Ordner wie die ZIP-Datei erstellt. Um die Dateien in einen anderen Ordner zu extrahieren, klicken Sie auf „Durchsuchen“..
Navigieren Sie zu dem Ort, an dem der Inhalt der ZIP-Datei extrahiert werden soll, und klicken Sie auf "Neuer Ordner", um ggf. einen neuen Ordner zu erstellen. Klicken Sie auf "Ordner auswählen"..
Um ein Datei-Explorer-Fenster (oder Windows Explorer) zu öffnen, in dem der Ordner mit den extrahierten Dateien nach dem Extrahieren angezeigt wird, aktivieren Sie das Kontrollkästchen "Extrahierte Dateien anzeigen, wenn der Vorgang abgeschlossen ist", sodass das Kontrollkästchen aktiviert ist. Klicken Sie auf "Extrahieren"..
Zugriff auf die extrahierten Bilder
Der extrahierte Inhalt enthält einen Ordner mit dem Namen "word", wenn Ihre Originaldatei ein Word-Dokument ist (oder "xl" für ein Excel-Dokument oder "ppt" für ein PowerPoint-Dokument). Doppelklicken Sie auf den Ordner "Word", um ihn zu öffnen.
Doppelklicken Sie auf den Ordner "Medien".
Alle Bilder der Originaldatei befinden sich im Ordner „Medien“. Die extrahierten Dateien sind die vom Dokument verwendeten Originalbilder. Innerhalb des Dokuments gibt es möglicherweise eine Größenänderung oder andere Eigenschaften, aber die extrahierten Dateien sind Rohbilder ohne diese Eigenschaften.
Zugriff auf den extrahierten Text
Wenn auf Ihrem PC kein Office installiert ist und Sie Text aus einer Word- (oder Excel- oder PowerPoint-Datei) extrahieren müssen, können Sie auf den extrahierten Text in der Datei "document.xml" im Ordner "word" zugreifen.
Sie können diese Datei in einem Texteditor öffnen, z. B. Notepad oder WordPad. Das Lesen in einem speziellen XML-Editor, z. B. dem kostenlosen Programm XML Notepad, ist jedoch einfacher. Der gesamte Text aus der Datei ist unabhängig vom Stil und / oder der Formatierung des Dokuments in Klartextblöcken verfügbar. Wenn Sie kostenlose Software herunterladen, um diesen Text anzuzeigen, können Sie natürlich auch LibreOffice herunterladen, das Microsoft Office-Dokumente lesen kann.
So extrahieren Sie eingebettete OLE-Objekte oder angehängte Dateien
Um auf eingebettete Dateien in einem Word-Dokument zuzugreifen, wenn Sie keinen Zugriff auf Word haben, öffnen Sie zunächst die Word-Datei in WordPad (in Windows integriert). Möglicherweise stellen Sie fest, dass einige der eingebetteten Dateisymbole nicht angezeigt werden, diese jedoch immer noch vorhanden sind. Einige eingebettete Dateien können teilweise Dateinamen haben. WordPad unterstützt nicht alle Features von Word. Daher kann es vorkommen, dass Inhalte nicht richtig angezeigt werden. Sie sollten jedoch auf die Dateien zugreifen können.
Wenn wir mit der rechten Maustaste auf eine der eingebetteten Dateien in unserer Beispiel-Word-Datei klicken, ist eine der Optionen „PDF-Objekt öffnen“. Dadurch wird die PDF-Datei im Standard-PDF-Reader-Programm auf Ihrem PC geöffnet. Von dort können Sie die PDF-Datei auf Ihrer Festplatte speichern.
Wenn WordPad keine Option zum Öffnen Ihrer Datei hat, notieren Sie sich hier den Dateityp. Unsere zweite Datei in diesem Dokument ist beispielsweise eine MP3-Datei.
Kehren Sie dann zu Ihrem Ordner "Files from [Document]" zurück und doppelklicken Sie auf den Ordner "embeddings" im Ordner "word".
Leider werden die Dateitypen nicht in den Dateinamen beibehalten. Sie alle haben stattdessen die Dateierweiterung ".bin". Wenn Sie wissen, welche Dateitypen in die Datei eingebettet sind, können Sie wahrscheinlich anhand der Dateigröße ableiten, welche Datei welche ist. In unserem Beispiel hatten wir eine PDF-Datei und eine MP3-Datei in unser Dokument eingebettet. Da die MP3-Datei höchstwahrscheinlich größer ist als die PDF-Datei, können wir herausfinden, welche Datei welche ist, indem Sie die Dateigrößen betrachten und sie mit den richtigen Erweiterungen umbenennen. Im Folgenden benennen wir die MP3-Datei um.
Beachten Sie, dass nicht notwendigerweise alle Dateien mit diesem Prozess geöffnet werden können, z. B. unsere PDF-Datei wurde ordnungsgemäß von WordPad aus geöffnet. Sie konnten sie jedoch nicht durch Umbenennen der .bin-Datei öffnen.
Nachdem Sie den Inhalt der gezippten Datei extrahiert haben, können Sie die Erweiterung der ursprünglichen Datei auf .docx, .xlsx oder .pptx zurücksetzen. Die Datei bleibt erhalten und kann im entsprechenden Programm normal geöffnet werden.
Extrahieren von Bildern aus älteren Office-Dokumenten (.doc, .xls oder .ppt)
Wenn Sie Bilder aus einem Office 2003-Dokument (oder einem früheren Dokument) extrahieren müssen, gibt es ein kostenloses Tool namens Office Image Extraction Wizard, das diese Aufgabe vereinfacht. Mit diesem Programm können Sie auch Bilder aus mehreren Dokumenten (desselben oder unterschiedlichen Typs) gleichzeitig extrahieren. Laden Sie das Programm herunter und installieren Sie es (es ist auch eine portable Version verfügbar, wenn Sie es nicht installieren möchten).
Führen Sie das Programm aus und der Begrüßungsbildschirm wird angezeigt. Weiter klicken".
Zuerst müssen Sie die Datei auswählen, aus der Sie die Bilder extrahieren möchten. Klicken Sie im Bildschirm "Eingabe & Ausgabe" auf die Schaltfläche "Durchsuchen" (Ordnersymbol) rechts neben dem Dokumentbearbeitungsfeld.
Navigieren Sie zu dem Ordner, der das gewünschte Dokument enthält, wählen Sie es aus und klicken Sie auf "Öffnen"..
Der Ordner, der die ausgewählte Datei enthält, wird automatisch zum Ausgabeordner. Um einen Unterordner in diesem Ordner zu erstellen, der den Namen der ausgewählten Datei trägt, aktivieren Sie das Kontrollkästchen "Ordner hier erstellen", sodass das Kontrollkästchen aktiviert ist. Klicken Sie dann auf "Weiter"..
Klicken Sie im Bildschirm "Bereit zum Start" auf "Start", um mit dem Extrahieren der Bilder zu beginnen.
Der folgende Bildschirm wird während des Extraktionsvorgangs angezeigt.
Klicken Sie im Bildschirm "Fertig" auf "Zum Öffnen des Zielordners hier klicken", um die resultierenden Bilddateien anzuzeigen.
Da wir uns für die Erstellung eines Unterordners entschieden haben, erhalten wir einen Ordner mit den aus der Datei extrahierten Bilddateien.
Sie sehen alle Bilder als nummerierte Dateien.
Sie können Bilder auch gleichzeitig aus mehreren Dateien extrahieren. Aktivieren Sie dazu auf dem Bildschirm Eingabe und Ausgabe das Kontrollkästchen „Stapelmodus“, sodass das Kontrollkästchen aktiviert ist.
Der Bildschirm „Stapeleingabe und -ausgabe“ wird angezeigt. Klicken Sie auf "Dateien hinzufügen"..
Navigieren Sie im Dialogfeld "Öffnen" zu dem Ordner mit den Dateien, aus denen Sie Bilder extrahieren möchten, wählen Sie die Dateien mit der Taste "Umschalt" oder "Strg" aus, um mehrere Dateien auszuwählen, und klicken Sie auf "Öffnen"..
Sie können Dateien aus einem anderen Ordner hinzufügen, indem Sie erneut auf "Dateien hinzufügen" klicken, im Dialogfeld "Öffnen" zu dem Ordner navigieren, die gewünschten Dateien auswählen und auf "Öffnen" klicken..
Nachdem Sie alle Dateien hinzugefügt haben, aus denen Sie Bilder extrahieren möchten, können Sie für jedes Dokument einen separaten Ordner in demselben Ordner wie jedes Dokument erstellen, in dem die Bilddateien gespeichert werden. Klicken Sie dazu auf „Ordner erstellen für Kontrollkästchen für jedes Dokument “. Das Kontrollkästchen enthält ein Häkchen.
Sie können auch festlegen, dass der Ausgabeordner als "Entspricht dem Eingabeordner jeder Datei" gilt, oder Sie können einen benutzerdefinierten Ordner mithilfe des Bearbeitungsfelds und der Schaltfläche "Durchsuchen" unterhalb dieser Option eingeben oder auswählen. Klicken Sie auf "Weiter", nachdem Sie die gewünschten Optionen ausgewählt haben.
Klicken Sie im Bildschirm "Bereit zum Start" auf "Start".
Der folgende Bildschirm zeigt den Fortschritt der Extraktion an.
Die Anzahl der extrahierten Bilder wird auf dem Bildschirm "Fertig" angezeigt. Klicken Sie auf „Schließen“, um den Assistenten zum Extrahieren von Office-Bildern zu schließen.
Wenn Sie für jedes Dokument einen separaten Ordner erstellen, werden Ordner mit denselben Namen angezeigt wie die Dateien, die die Bilder enthalten, je nachdem, welche Ausgabeordner Sie angegeben haben.
Wieder erhalten wir alle Bilder als nummerierte Dateien für jedes Dokument.
Jetzt können Sie die Bilder umbenennen, verschieben und in Ihren eigenen Dokumenten verwenden. Stellen Sie nur sicher, dass Sie die Rechte haben, sie legal zu verwenden.