5 Grep Tools für Linux

5 Grep Tools für Linux

⌛ Reading Time: 5 minutes

Wie jeder Linux-Benutzer sicherlich weiß, ist grep ein zuverlässiges Befehlszeilentool für die eingehende Suche nach Dateien. Dennoch vermeiden es viele Anfänger, weil sie das Terminal nicht mögen. Die in diesem Artikel vorgestellten Apps sind keine Alternativen zu grep, da grep in einigen Nutzungsszenarien wirklich unersetzlich ist. Nennen wir sie stattdessen visuelle Upgrades für grep, weil sie die Funktionalität von grep erweitern und in eine vollwertige grafische Oberfläche einbinden.

1. Regexxer

Regexxer ist ein praktisches Dateisuchwerkzeug, mit dem Sie Dateien direkt über die Benutzeroberfläche bearbeiten können. Sie können nach Namen und Dateien nach Namen suchen und in textbasierten Dateien (einschließlich HTML- und XML-Dateien) suchen. Auf der linken Seite des Fensters können Sie den Zielordner und das Muster auswählen (* für alle Dateien oder * .txt nur für Textdateien). Regexxer kann eine rekursive Suche in Unterordnern eines ausgewählten Ordners durchführen und versteckte Dateien in die Ergebnisse aufnehmen.

Auf der rechten Seite des Fensters können Sie eine ausgewählte Datei suchen und ersetzen. Hier können Sie nur eine Instanz einer gefundenen Phrase oder alle automatisch ersetzen. Sie können die ausgewählte Phrase auch in allen gefundenen Dateien ersetzen, was für die Stapelbearbeitung hilfreich ist.

2. Searchmonkey

Zurück in den Tag Searchmonkey war sehr beliebt. Irgendwann wurde die Entwicklung der Linux-Version eingestellt, und jetzt bietet die Website neue Downloads nur für Windows an. Die alte Version kann jedoch aus den Repositorys fast aller Linux-Distributionen installiert werden. Vielleicht überraschend, es funktioniert großartig und es ist sehr schnell. Mit Searchmonkey können Sie Dateien und Ordner nach Namen suchen oder deren Inhalt durchsuchen und mit regulären Ausdrücken nach Phrasen suchen.

grep-tools-searchmonkey

Mit Searchmonkey können Sie komplexe Abfragen mit dem Dateiausdruck-Assistenten (aktiviert durch Klicken auf die Schaltfläche Ausdrucksgenerator) und einer Option namens “Regulären Ausdruck testen” (im Menü “Extras”) erstellen. Es kann rekursiv nach Dateien suchen und Sie können die Suchtiefe festlegen (in wie viele Unterordner es schauen soll) und Dateien nach Größe und Datum filtern. Auf der Registerkarte “Optionen” können Sie die Anzahl der Dateien in den Ergebnissen begrenzen und auswählen, wie viele Kontextzeilen angezeigt werden sollen.

3. DocFetcher

Anstatt Ihr Dateisystem direkt zu durchsuchen, DocFetcher Sie werden aufgefordert, einen Index zu erstellen und dann nur in indizierten Dateien nach Ihren Abfragen zu suchen. Es bietet eine tragbare Version (einfach entpacken und die .sh-Datei vom Terminal ausführen) für 32- und 64-Bit-Systeme. Um einen Index zu erstellen, klicken Sie mit der rechten Maustaste in den Bereich “Suchbereich” auf der linken Seite.

grep-tools-docfetcher

Sie können dem Index Ordner hinzufügen, die Indexerstellung anhalten und später fortsetzen, Archivdateien (ZIP, TAR) als Ordner indizieren und ausgewählte Dateien mithilfe regulärer Ausdrücke aus dem Index ausschließen.

DocFetcher verfügt über einen integrierten HTML-Renderer, mit dem Sie eine Vorschau von HTML-Dateien mit Formatierung und Bildern anzeigen können. Es bietet eine datenschutzbewusste Option zum Entfernen des Suchverlaufs und ermöglicht die Suche nach und innerhalb von Dateien mithilfe von Platzhaltern, Booleschen Operatoren, Fuzzy-Suche (findet ähnliche Wörter), Näherungssuche (wie weit die Wörter im Text voneinander entfernt sein sollten) und Mehr. DocFetcher unterstützt eine beeindruckende Anzahl von Formaten, darunter Microsoft- und Libre Office-Dateien (DOC, DOCX, ODT, OTP…), PDF und EPUB, HTML und XML, Outlook PST-E-Mail-Dateien sowie Audio- und Bildmetadaten.

4. Wiedergewinnen

Wiedergewinnen ist eine Suchmaschine für Ihren Desktop; so etwas wie Google, aber für Ihre Dateien und Ordner. Es ist in Java geschrieben, funktioniert also unter Linux, OS X und Windows, vorausgesetzt, Sie haben Java ordnungsgemäß installiert und konfiguriert. Die Installationsdatei ist verfügbar auf der ProjektwebsiteSie können es einfach in einen Ordner extrahieren, diesen Ordner im Terminal öffnen und ausführen java -jar regain.jar um die Anwendung zu starten. (Die Datei “regain.jar” muss ausführbar sein). Regain wird in Ihrem Standard-Webbrowser ausgeführt.

grep-tools-regain

Um nach Ihren Dateien und Ordnern zu suchen, muss Regain zuerst Ihr System crawlen und einen Suchindex erstellen. Im Formular “Einstellungen” fügen Sie die Ordner hinzu, die indiziert werden sollen. Wenn Sie bestimmte Dateien nicht in den Index aufnehmen möchten, listen Sie sie in der Datei “CrawlerConfiguration.xml” auf. Sobald Sie Regain verwenden, wird der Index durchsucht, anstatt die gesamte Festplatte zu scannen. Dies spart Systemressourcen und beschleunigt die Suche.

5. PDFgrep

Von allen Tools auf dieser Liste PDFgrep ist dem ursprünglichen grep am ähnlichsten, aber es ist auch “das ungerade”, da es ein Befehlszeilen-Tool ist. Mehrere Distributionen bieten PDFgrep in ihren Repositories an, aber die neueste Version (derzeit 1.3.2) muss kompiliert werden.

Während grep die Zeilennummer ausgibt, in der die Suchzeichenfolge angezeigt wird, zeigt PDFgrep stattdessen die Seitenzahl an. Dies ist für PDF-Dateien nützlicher, da wir sie eher wie Bücher lesen und nicht zeilenweise analysieren. PDFgrep funktioniert nur mit PDF-Dateien. Sie müssen entweder aus Text oder OCR konvertiert werden, nicht nur aus gescannten Bildern.

grep-tools-pdfgrep

Geben Sie Folgendes ein, um in einer PDF-Datei nach einem Wort zu suchen:

Verwenden Sie die Option, um den Fall zu ignorieren -i::

Dies findet “Wort”, “Wort”, “WORT” und andere mögliche Kombinationen. Wenn Sie nach einer Phrase suchen, setzen Sie sie in Anführungszeichen. Einige nützliche Optionen sind:

  • -n: gibt die Seitenzahl für jede Übereinstimmung aus
  • -c: Gibt nur die Anzahl der Übereinstimmungen in einer Datei aus
  • -p Zeigt die Anzahl der Übereinstimmungen pro Seite an
  • -C NUMBER: druckt die ausgewählte Anzahl von Zeichen um jede Übereinstimmung für den Kontext. Anstelle einer Zahl können Sie auch “Zeile” schreiben, und PDFgrep druckt die gesamte Zeile.

PDFgrep kann rekursiv in allen Unterordnern eines aktiven Ordners suchen und mehrere PDF-Dateien durchsuchen. Es unterstützt auch reguläre Ausdrücke und Optionen können kombiniert werden:

Dies würde die Seitenzahl und den Dateinamen für jede Übereinstimmung drucken (wegen der -H Möglichkeit).

Mit welchen Linux-Tools und -Befehlen suchen Sie nach Dateien? Teilen Sie Ihre Favoriten in den Kommentaren unten.

How useful was this post?

Click on a star to rate it!

Average rating 0 / 5. Vote count: 0

No votes so far! Be the first to rate this post.