Startseite » Desktop » So extrahieren Sie Text und Bilder einfach aus MS Office-Dateien

    So extrahieren Sie Text und Bilder einfach aus MS Office-Dateien

    Möglicherweise stoßen wir auf die Notwendigkeit, Bilder oder Text aus einer MS Word- oder MS Powerpoint-Datei zu extrahieren. Normalerweise umfasst dies das manuelle Kopieren und Einfügen von Seiten zu Seiten. Bei großen Dateien wird dies einige Zeit in Anspruch nehmen.

    Nun, wir haben einen einfachen Trick, um Ihnen zu helfen Bild und Text aus Dateien des neuen Formats extrahieren dh DOCX, PPTX, XLSX, wohingegen bei Dateien des älteren Formats, dh DOC, PPT, XLS, alles, was Sie brauchen, ein ist gratis Software um Ihnen zu helfen, Bilder schnell und einfach zu extrahieren.

    Hinweis: Zur Veranschaulichung dieses Beitrags verwenden wir nur eine MS Word-Datei. Der Vorgang ist für MS Powerpoint- und MS Excel-Dateien derselbe.

    In diesem Artikel wird Folgendes behandelt:

    1. So extrahieren Sie Bilder und Text aus DOCX-, PPTX-, XLXS-Dateien
    2. So extrahieren Sie Bilder aus einer einzelnen DOC-, PPT- oder XLS-Datei
    3. So extrahieren Sie Bilder aus mehreren DOC-, PPT- oder XLS-Dateien
    4. So extrahieren Sie Bilder mit “Als Webseite speichern” Methode
    5. So extrahieren Sie Klartext anstelle von XML

    So extrahieren Sie Bilder und Text aus DOCX-, PPTX-, XLXS-Dateien

    Bevor Sie die Schritte ausführen, öffnen Sie den Ordner mit Ihren Dateien. klicken Organisieren> Ordner- und Suchoptionen> Ansicht und deaktivieren Erweiterungen für bekannte Dateitypen verbergen. Jetzt können Sie die Dateierweiterung mit jedem Dateinamen sehen.

    1. Suchen und auswählen die Datei, aus der Sie Bilder und Text extrahieren möchten (Hinweis: Es ist besser, eine Kopie der Datei zu erstellen). In diesem Beispiel heißt unsere Zieldatei Beispiel File.docx.

    2. Drücken Sie F2 um die Datei umzubenennen und den Erweiterungsnamen durch zu ersetzen .Postleitzahl.

    3. Eine Warnung wird angezeigt, um die Änderung der Dateierweiterung zu bestätigen. Klicken Ja.

    4. Rechtsklick in der ZIP-Datei und klicken Sie auf Dateien extrahieren.

    5. Suchen und öffnen Sie den Ordner mit den extrahierten Daten und öffnen Sie dann das Verzeichnis Wort.

    6. Darin sehen Sie einige Ordner und XML-Dateien. In dem Medien Ordner finden Sie die extrahierten Bilder. Öffnen Sie für den extrahierten Text die document.xml Datei mit Notepad oder XML Notepad.

    Folgendes finden Sie in der Medien Mappe.

    So extrahieren Sie Bilder aus einer einzelnen DOC-, PPT- oder XLS-Datei

    Wenn Sie Bilder aus MS-Office-Dateien mit extrahieren möchten ältere Formate, Die obige Methode funktioniert nicht mit den Bildern. Zu diesem Zweck benötigen Sie ein kostenloses Tool namens Office Image Extraction Wizard. Das Tool arbeitet bereits seit 2012 mit MS-Office-Dateien zusammen und kann mit einer oder mehreren MS-Office-Dateien gleichzeitig ausgeführt werden.

    1. Laden Sie und Installieren Assistent zum Extrahieren von Office-Bildern.

    2. Wählen Sie das Dokument, aus dem Sie Bilder extrahieren möchten (in diesem Beispiel machen wir es in einem Ordner, den ich benannt habe) Ch1.doc) und wählen Sie den Ausgabeordner. Sie können festlegen, dass ein Ordner erstellt wird, in dem alle Ausgabebilder gespeichert werden, indem Sie die Option aktivieren Legen Sie hier einen Ordner an. Wenn Sie fertig sind, klicken Sie auf Nächster.

    3. Klicken Start um den Prozess zu beginnen.

    4. Klicken Sie nach Abschluss der Bildextraktion auf Klicken Sie hier, um den Zielordner zu öffnen und es öffnet sich der Ausgabeordner.

    5. Wie Sie unten sehen können, hat das Programm eine erstellt Ch1 Mappe.

    6. In dem Ordner befinden sich die extrahierten Bilder.

    So extrahieren Sie Bilder aus mehreren DOC-, PPT- oder XLS-Dateien

    1. Um Bilder aus mehreren Dateien der Formate DOC, PPT oder XLS zu extrahieren, markieren Sie die Option Batch-Modus Option unten links.

    2. Klicke auf Dateien hinzufügen und dann wählen die Dateien, aus denen Sie Bilder extrahieren möchten. Halte das Ctrl Taste, um mehrere Dateien auf einmal auszuwählen. Klicken Sie nach der Auswahl der Dateien auf Nächster.

    3. Klicken Start.

    4. Wenn der Vorgang abgeschlossen ist, suchen Sie und öffnen Sie die Ausgabeordner. Hier wirst du sehen zwei Ordner mit den ursprünglichen Dateinamen. Öffnen In diesen Ordnern können Sie die extrahierten Bilder aus ihren ursprünglichen MS Office-Dateien anzeigen.

    So extrahieren Sie Bilder mit der Methode "Als Webseite speichern"

    Es gibt eine andere Methode, die mit beiden funktioniert neuer und älter MS Office-Dateien.

    1. Öffnen Sie die DOCX- oder XLSX-Datei und klicken Sie auf Datei> Speichern unter> Computer> Browser und speichern Sie die Datei als Website.

    2. Lokalisieren Der Ordner mit dem Dateinamen, in dem Sie die Webseite gespeichert haben. Hier sehen Sie alle aus der Datei extrahierten Bilder.

    So extrahieren Sie Klartext anstelle von XML

    1. Öffnen Sie die DOCX-Datei und klicken Sie auf Datei> Speichern unter> Computer> Browser. Wählen Sie zum Speichern der Datei Einfacher Text (für XLSX-Dateien speichern Sie es als Text (Tabulator getrennt)).

    2. Lokalisieren und öffnen die Textdatei mit dem Namen, unter dem Sie sie gespeichert haben. Diese Textdatei enthält nur den Text Ihrer Originaldatei ohne Formatierung.

    Wenn Sie eine andere Methode oder ein anderes Tool zum Extrahieren von Bildern aus MS Office-Dateien kennen, geben Sie dies bitte im Abschnitt an Bemerkungen Sektion.