Octoparse Review: Web Scraping leicht gemacht

Octoparse Review: Web Scraping leicht gemacht

⌛ Reading Time: 7 minutes

Web-Scraping oder automatische Datenextraktion können sowohl für Einzelpersonen als auch für Unternehmen ein unglaublich wertvolles Werkzeug sein. Während Web-Scraping manuell durchgeführt werden kann, kann es schnell zu einer unglaublich mühsamen Aufgabe werden. Um den Vorgang zu beschleunigen, wird empfohlen, dass sich Benutzer stattdessen an ein Web-Scraping-Tool wenden, wie es von Octoparse angeboten wird. Das Unternehmen hat kürzlich eine neue Version (8.4) seiner Software auf den Markt gebracht, die eine Reihe von Verbesserungen mit sich bringt. In diesem Artikel schauen wir uns genauer an, was Octoparse 8.4 auf den Tisch bringt.

Hinweis: Dies ist ein gesponserter Artikel und wurde von Octoparse ermöglicht. Die tatsächlichen Inhalte und Meinungen sind die alleinigen Ansichten des Autors, der die redaktionelle Unabhängigkeit behält, auch wenn ein Beitrag gesponsert wird.

Octoparse 8.4 kennenlernen

Octoparse ist ein einfach zu bedienendes Web-Scraping-Tool mit vielen Funktionen. Es wird mit einer Reihe praktischer Vorlagen geliefert, mit denen Benutzer ohne großen Aufwand sofort mit dem Web-Scraping beginnen können. Da Octoparse keine Programmierkenntnisse erfordert, kann jeder die Data-Mining-Software verwenden.

Es ist jedoch eine konsistente Lernkurve zu beachten, wenn Sie dieses Programm in vollem Umfang nutzen möchten. Glücklicherweise stellt Octoparse Ihnen eine breite Bibliothek von Tutorials zur Verfügung, damit Sie sich in kürzester Zeit über die Durchführung verschiedener Aufgaben informieren können.

Oktoparse 8,4 ist für Benutzer von Windows (7, 8, 10) oder macOS (10.10 und höher) auf der offiziellen Website verfügbar. Wenn Sie ein Windows XP- oder x32-System verwenden, müssen Sie die ältere Octoparse 7.3.0-Version herunterladen.

Was können Sie mit Octoparse 8.4 tun?

Mit Octoparse können Sie alle Arten von Daten extrahieren, einschließlich Produktdaten von großen E-Commerce-Websites wie Amazon, eBay, Target, Walmart und mehr. Darüber hinaus kann das Tool auf große Social-Media-Websites wie Facebook, Twitter, Instagram, YouTube usw. abzielen, um Beiträge, Kommentare, Bilder und mehr zu erfassen.

Octoparse Review Web Scraping leicht gemacht

Wenn Sie Octoparse 8.4 öffnen, finden Sie eine Reihe von Vorlagen, die genau auf diese Websites ausgerichtet sind. Die Facebook-Vorlage ist beispielsweise so konzipiert, dass sie Kommentare für jeden Beitrag von einer Facebook-Kontoseite abkratzt. Um es auszuprobieren, müssen Sie nur auf die blaue Schaltfläche “Ausprobieren” klicken.

Darüber hinaus kann Octoparse Ihnen helfen, Hotelpreise, Bewertungen und Rezensionen auf Websites wie Booking oder TripAdvisor zu verfolgen oder eine spezielle Datenbank zu erstellen, indem Sie Informationen von Websites wie Yellow Pages, Yelp, Crunchbase und mehr aussortieren.

Nach Abschluss des Web-Scrapings können Octoparse-Benutzer die Ergebnisse in verschiedene Formate exportieren, darunter Excel, HTML, TXT, CVS oder Datenbanken wie MySQL, SQL Server und Oracle.

Arbeiten mit dem erweiterten Modus

Abgesehen von den Vorlagen können Sie mit Octoparse Daten von jeder Website abkratzen. Es ist ganz einfach, eine Operation einzurichten. In der neuen Version gibt es ein neues Layout, das den Workflow von links nach rechts wechselt. Es gibt auch einen erweiterten Einstellungsbereich an der Ecke, der es den Benutzern erleichtert, gewünschte Aktionen zu definieren.

Insgesamt ist die Benutzeroberfläche geräumiger und fühlt sich an, als hätten Sie viel Platz zum Atmen. Trotzdem empfehlen wir, beim Arbeiten in Octoparse einen größeren Monitor zu verwenden. Trotz des Updates fühlt sich das Erlebnis auf einem Standard-Laptop immer noch etwas beengt an.

Im erweiterten Modus müssen Sie eine relevante URL in die Anwendung einfügen.

Octoprase 8.4 Web Scraping Tool Update Review Link Erste Schritte

Als nächstes lädt das Programm die Seite automatisch und extrahiert die Informationen, die es für relevant hält. Die Ergebnisse werden im unteren Teil des Displays angezeigt. Sie können die Felder, die Sie nicht interessieren, entfernen, indem Sie einfach auf die drei Punkte klicken und dann die Option “Löschen” auswählen.

Octoprase 8.4 Web Scraping Tool Update Autoscan

Die neueste Version nutzt die Webview-Technik im Browser, die hervorragende Frostschutzfunktionen bietet. Unsere Tests haben keine nervigen Probleme mit dem Einfrieren von Seiten ergeben.

Behalten Sie die Tipps im Auge

Wenn Sie die obigen Anweisungen befolgen, extrahiert Octoparse nur Daten von der aktuellen Seite, aber wenn Sie möchten, dass das Programm von allen Seiten Daten auswertet, müssen Sie eine Paginierungsschleife erstellen. Der erste Schritt dazu ist die Erstellung eines Workflows. Klicken Sie auf die Schaltfläche, um zu beginnen.

Octoprase 8.4 Web Scraping Tool Update Workflow erstellen

Das Vorschlagsfeld zeigt nun eine Reihe von Optionen an. Wählen Sie “Klicken Sie auf die Schaltfläche “Mehr laden”” und scrollen Sie dann zum Ende der Seite, bis Sie die Schaltfläche “Nächste Seite” oder etwas Ähnliches finden. Klicken Sie darauf und klicken Sie auf die Schaltfläche “Bestätigen”.

Octoprase 8.4 Web Scraping Tool Update Schaltfläche

Wenn Sie mehr Daten benötigen, als Octoparse ursprünglich aufgenommen hat, können Sie ein zweites Element erstellen, das jedes Element in der Liste auswählt und die gewünschten Daten erfasst.

Gehen Sie zunächst zu einem Element in der Liste, klicken Sie darauf und wählen Sie dann die Option „URL anklicken“ aus dem Menü „Tipps“.

Octoprase 8.4 Web Scraping Tool Update Click Element

Die dedizierte Seite des Artikels wird nun geladen. Klicken Sie auf die entsprechenden Felder, und sie werden unten angezeigt. Sie können sie bearbeiten, wenn Sie möchten.

Octoprase 8.4 Web Scraping Tool Update Alle einzelnen Felder überprüfen

Führen Sie die Aufgabe aus

Wenn Sie mit der Gliederung der von Ihnen erstellten Aufgabe endgültig zufrieden sind, ist es an der Zeit, sie auf Ihrem Gerät auszuführen oder zu planen (Lokal). Es ist auch möglich, es in der Cloud auszuführen, aber das ist eine Option, die nur für diejenigen mit einem Plan verfügbar ist.

Octoprase 8.4 Web Scraping Tool Update Überprüfung auf Gerät ausführen

Der Prozess des Scrapings dauert nicht allzu lange, und wenn es fertig ist, können Sie sofort auf die Schaltfläche “Daten exportieren” klicken und von dort aus Ihr bevorzugtes Format auswählen.

Octoprase 8.4 Web Scraping Tool Update Review Export

Octoparse ist ziemlich komplex und man kann damit mehr erreichen, als nur einfache Aufgaben einzurichten. Beispiel: Verfeinern der extrahierten Daten. Mit dem RegEx-Tool in der Toolbox können Sie die Daten bereinigen, z. B. Text ersetzen.

Octoprase 8.4 Web Scraping Tool Update Alle Toolbox überprüfen

Hallo Zapier!

Wir sollten auch beachten, dass Octoparse mit Version 8.4 seine Kräfte mit Zapier zusammengetan hat und diese Integration bedeutet, dass Benutzer den Web-Scraping-Dienst jetzt in Kombination mit Tausenden von Apps wie Google Drive, Google Sheets, Slack und anderen verwenden können.

Um mit der Integration von Workflows zu beginnen, müssen Sie auf Ihrem Gerät auf Zapier zugreifen. Klicken Sie dann auf die Schaltfläche „Create Zap“ auf der rechten Seite des Displays. Wir wollten einen Zap einrichten, der Google Drive-Dateien durch neue Dokumente ersetzt, die in Octoparse verarbeitet wurden.

Um einen Trigger einzurichten, müssen Sie die Suchleiste verwenden, um Octoparse zu suchen und auszuwählen. Verbinden Sie sich mit Ihrem Octoparse-Konto und beginnen Sie mit der Einrichtung des Triggers. Wählen Sie die Octoparse-Zielaufgabe, die Sie nach ID durchsuchen können, und legen Sie dann Ihren idealen Aufgabenstatus fest. Das Auffinden der Aufgaben-ID ist etwas schwierig, wenn Sie es zum ersten Mal tun. Glücklicherweise hat die Dokumentation Sie abgedeckt, sodass Sie es schnell herausfinden können. (Tipp: Sie müssen die Aufgabe in der Cloud ausführen.)

Octoprase 8.4 Web Scraping Tool Update Review Wählen Sie Ihre Aufgabe

Als Nächstes müssen Sie die Aktions-App auswählen, in diesem Beispiel Google Docs.

Octoprase 8.4 Web Scraping Tool Update Review Setup Action

In diesem Abschnitt müssen Sie mehrere Parameter definieren. Das wichtigste ist das Aktionsereignis, also stellen Sie sicher, dass Sie eine geeignete Option auswählen. Danach müssen Sie in den Feldern „Aktion einrichten“ weitere Details zur Aktion angeben.

Octoprase 8.4 Web Scraping Tool Update Überprüfung Aktion einrichten Vollansicht

Der Prozess erwies sich beim nächsten Mal als ziemlich reibungslos, als wir versuchten, einen neuen Zap zu erstellen. Es ist nur ein wenig gewöhnungsbedürftig. Möglicherweise müssen Sie auch ein wenig lesen. Glücklicherweise bieten sowohl Zapier als auch Octoparse ihre eigene Bibliothek mit Tutorials an, sodass Sie nicht gezwungen sind, viel Zeit in die Recherche zu investieren.

Holen Sie sich jetzt Octoparse

Sie können Octoparse kostenlos testen, was perfekt für diejenigen ist, die ein paar einfache Projekte durchführen möchten. Melden Sie sich mit einem Konto an, um loszulegen. Um jedoch Zugriff auf alle Funktionen zu erhalten, müssen Sie auf einen der drei kostenpflichtigen Pläne upgraden:

  • Standardplan: 75 USD/Monat
  • Professional-Plan: 209 USD/Monat
  • Enterprise Plan: benutzerdefinierte Funktionen auf Anfrage verfügbar
Octoprase 8.4 Web Scraping Tool Update-Pläne

Während Sie in der kostenlosen Version viele Dinge tun können, bieten die kostenpflichtigen Versionen erweiterte Optionen. Dazu gehören der Zugriff auf eine größere Anzahl von Crawlern, geplante Extraktionen, gleichzeitige Cloud-Extraktionen, automatische IP-Rotation, API-Zugriff, E-Mail-Support und mehr.

Wenn Sie neugierig auf Octoparse sind, können Sie zuerst die kostenlose Stufe erwerben und sehen, wie gut sie Ihren Anforderungen entspricht. Die neueste Version ist verfügbar für herunterladen jetzt auf der offiziellen Website.

How useful was this post?

Click on a star to rate it!

Average rating 0 / 5. Vote count: 0

No votes so far! Be the first to rate this post.