So extrahieren Sie eingebettete Bilder aus einer PDF-Datei in Ubuntu mithilfe von PDFImages

Cum se extrag imagini încorporate dintr-un fișier PDF în Ubuntu folosind PDFImages
⏱️ 3 min read

Obwohl wir bereits wissen, wie vorhandene PDF-Dateien in Ubuntu bearbeitet werden, müssen manchmal alle oder einige der in einer PDF-Datei enthaltenen Bilder verwendet werden. Manuelles Kopieren und Einfügen ist definitiv eine Option, aber keine zeitsparende, insbesondere wenn die PDF-Datei eine große Anzahl von Bildern enthält.

Es gibt ein Tool, das synchronisiert wird PDFImages, das macht die Bildextraktion aus PDF-Dateien zu einem Kinderspiel. In diesem Artikel werden wir dieses Tool anhand leicht verständlicher Beispiele diskutieren. Beachten Sie, dass alle in diesem Artikel verwendeten Beispiele unter Ubuntu 14.04 LTS mit Version 0.24.5 des Tools getestet wurden.

Was ist PDFImages?

Wie bereits erwähnt, ist PDFImages ein Befehlszeilenprogramm, mit dem Sie Bilder aus einer PDF-Datei extrahieren können. Auf der Manpage des Tools wird angegeben, dass die eingegebene PDF-Datei gelesen, gescannt und für jedes Bild in der PDF-Datei eine Portable Pixmap- (PPM), Portable Pixmap- (PBM) oder JPEG-Datei erstellt wird.

Herunterladen und installieren

Wenn das Tool noch nicht auf Ihrer Ubuntu-Box installiert ist, können Sie es mit dem folgenden Befehl herunterladen und installieren:

Neben PDFImages enthält auch das Paket „poppler-utils“ mehrere andere Befehlszeilenprogramme um Informationen aus PDF-Dokumenten abzurufen, in andere Formate zu konvertieren oder zu bearbeiten.

Verwendung

Das Befehlszeilentool PDFImages erfordert in seiner grundlegendsten Form zwei Argumente: Eingabe der PDF-Datei und Pfad zu dem Verzeichnis, in dem das Tool die Bilder speichern soll. In meinem Fall habe ich beispielsweise versucht, Bilder aus einer PDF-Datei mit dem Namen “christmas_story.pdf” zu extrahieren und in einem Verzeichnis mit dem Namen “pdfimages” zu speichern.

Der obige Befehl erzeugte die folgenden Dateien im Zielverzeichnis:

Wie Sie in der obigen Ausgabe sehen können, beginnt der Name der Dateien mit einem Bindestrich (-) gefolgt von einer Zahl. Für diejenigen, die sich fragen, warum der Name mit einem Bindestrich beginnt, bietet das Tool die Flexibilität, jedem Wort vor dem Bindestrich ein Präfix voranzustellen, damit Sie benutzerdefinierte Namen für die Ausgabebilder erstellen können. Sie können dies tun, indem Sie dieses bestimmte Wort dem Pfad des Zielverzeichnisses hinzufügen, während Sie den Befehl ausführen.

Zum Beispiel habe ich das Wort “Bild” zum Pfad des Zielverzeichnisses hinzugefügt:

Die in diesem Fall erstellten Ausgabedateien trugen den folgenden Namen:

Es ist erwähnenswert, dass im Gegensatz zur Manpage des Tools für jedes Bild in der PDF-Datei zwei Bilder erstellt werden, von denen eines leer ist, während das andere verwendet werden kann. In meinem Fall waren die ungeradzahligen Bilder leer:

Im weiteren Verlauf können Sie auch das Format der Ausgabebilddatei von “ppm” in “jpeg” ändern -j Möglichkeit. Beachten Sie jedoch, dass mit dieser Option nur Bilder im DCT-Format als JPEG-Dateien gespeichert werden. Alle Nicht-DCT-Bilder werden wie gewohnt im PBM / PPM-Format gespeichert.

Sie können auch angeben, welche Seiten das Tool scannen soll. Auf diese Weise erhalten Sie nur die Bilder in der Ausgabe, die sich auf diesen Seiten befinden. Um diese Option zu aktivieren, müssen Sie die verwenden -f Option (gefolgt von der Seitenzahl) und -l (gefolgt von der Seitenzahl), um die Start- und Endseiten anzugeben.

Ich wollte beispielsweise, dass das Tool nur Bilder extrahiert, die auf der ersten Seite der PDF-Datei vorhanden sind, und habe daher den folgenden Befehl verwendet:

Und im Zielverzeichnis wurden nur zwei Bilder (insgesamt vier einschließlich der leeren) erstellt:

Fazit

PDFImages ist auf jeden Fall ein praktisches Werkzeug, wenn Sie sich mit PDF-Dateien und den darin enthaltenen Bildern befassen müssen. Wie Sie vielleicht inzwischen festgestellt haben, ist es leicht zu erlernen und zu verwenden. Um mehr über das Tool zu erfahren, gehen Sie zu dessen Manpage.

Join our Newsletter and receive offers and updates! ✅

0 0 votes
Article Rating
Avatar of Routech

Routech

Routech is a website that provides technology news, reviews and tips. It covers a wide range of topics including smartphones, laptops, tablets, gaming, gadgets, software, internet and more. The website is updated daily with new articles and videos, and also has a forum where users can discuss technology-related topics.

Das könnte dich auch interessieren …

Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x