Web-Scraping oder automatische Datenextraktion können sowohl für Einzelpersonen als auch für Unternehmen ein unglaublich wertvolles Werkzeug sein. Während Web-Scraping manuell durchgeführt werden kann, kann es schnell zu einer unglaublich mühsamen Aufgabe werden. Um den Vorgang zu beschleunigen, wird empfohlen, dass sich Benutzer stattdessen an ein Web-Scraping-Tool wenden, wie es von Octoparse angeboten wird. Das Unternehmen hat kürzlich eine neue Version (8.4) seiner Software auf den Markt gebracht, die eine Reihe von Verbesserungen mit sich bringt. In diesem Artikel schauen wir uns genauer an, was Octoparse 8.4 auf den Tisch bringt.
Hinweis: Dies ist ein gesponserter Artikel und wurde von Octoparse ermöglicht. Die tatsächlichen Inhalte und Meinungen sind die alleinigen Ansichten des Autors, der die redaktionelle Unabhängigkeit behält, auch wenn ein Beitrag gesponsert wird.
Octoparse 8.4 kennenlernen
Octoparse ist ein einfach zu bedienendes Web-Scraping-Tool mit vielen Funktionen. Es wird mit einer Reihe praktischer Vorlagen geliefert, mit denen Benutzer ohne großen Aufwand sofort mit dem Web-Scraping beginnen können. Da Octoparse keine Programmierkenntnisse erfordert, kann jeder die Data-Mining-Software verwenden.
Es ist jedoch eine konsistente Lernkurve zu beachten, wenn Sie dieses Programm in vollem Umfang nutzen möchten. Glücklicherweise stellt Octoparse Ihnen eine breite Bibliothek von Tutorials zur Verfügung, damit Sie sich in kürzester Zeit über die Durchführung verschiedener Aufgaben informieren können.
Oktoparse 8,4 ist für Benutzer von Windows (7, 8, 10) oder macOS (10.10 und höher) auf der offiziellen Website verfügbar. Wenn Sie ein Windows XP- oder x32-System verwenden, müssen Sie die ältere Octoparse 7.3.0-Version herunterladen.
Was können Sie mit Octoparse 8.4 tun?
Mit Octoparse können Sie alle Arten von Daten extrahieren, einschließlich Produktdaten von großen E-Commerce-Websites wie Amazon, eBay, Target, Walmart und mehr. Darüber hinaus kann das Tool auf große Social-Media-Websites wie Facebook, Twitter, Instagram, YouTube usw. abzielen, um Beiträge, Kommentare, Bilder und mehr zu erfassen.

Wenn Sie Octoparse 8.4 öffnen, finden Sie eine Reihe von Vorlagen, die genau auf diese Websites ausgerichtet sind. Die Facebook-Vorlage ist beispielsweise so konzipiert, dass sie Kommentare für jeden Beitrag von einer Facebook-Kontoseite abkratzt. Um es auszuprobieren, müssen Sie nur auf die blaue Schaltfläche “Ausprobieren” klicken.
Darüber hinaus kann Octoparse Ihnen helfen, Hotelpreise, Bewertungen und Rezensionen auf Websites wie Booking oder TripAdvisor zu verfolgen oder eine spezielle Datenbank zu erstellen, indem Sie Informationen von Websites wie Yellow Pages, Yelp, Crunchbase und mehr aussortieren.
Nach Abschluss des Web-Scrapings können Octoparse-Benutzer die Ergebnisse in verschiedene Formate exportieren, darunter Excel, HTML, TXT, CVS oder Datenbanken wie MySQL, SQL Server und Oracle.
Arbeiten mit dem erweiterten Modus
Abgesehen von den Vorlagen können Sie mit Octoparse Daten von jeder Website abkratzen. Es ist ganz einfach, eine Operation einzurichten. In der neuen Version gibt es ein neues Layout, das den Workflow von links nach rechts wechselt. Es gibt auch einen erweiterten Einstellungsbereich an der Ecke, der es den Benutzern erleichtert, gewünschte Aktionen zu definieren.
Insgesamt ist die Benutzeroberfläche geräumiger und fühlt sich an, als hätten Sie viel Platz zum Atmen. Trotzdem empfehlen wir, beim Arbeiten in Octoparse einen größeren Monitor zu verwenden. Trotz des Updates fühlt sich das Erlebnis auf einem Standard-Laptop immer noch etwas beengt an.
Im erweiterten Modus müssen Sie eine relevante URL in die Anwendung einfügen.

Als nächstes lädt das Programm die Seite automatisch und extrahiert die Informationen, die es für relevant hält. Die Ergebnisse werden im unteren Teil des Displays angezeigt. Sie können die Felder, die Sie nicht interessieren, entfernen, indem Sie einfach auf die drei Punkte klicken und dann die Option “Löschen” auswählen.

Die neueste Version nutzt die Webview-Technik im Browser, die hervorragende Frostschutzfunktionen bietet. Unsere Tests haben keine nervigen Probleme mit dem Einfrieren von Seiten ergeben.
Behalten Sie die Tipps im Auge
Wenn Sie die obigen Anweisungen befolgen, extrahiert Octoparse nur Daten von der aktuellen Seite, aber wenn Sie möchten, dass das Programm von allen Seiten Daten auswertet, müssen Sie eine Paginierungsschleife erstellen. Der erste Schritt dazu ist die Erstellung eines Workflows. Klicken Sie auf die Schaltfläche, um zu beginnen.

Das Vorschlagsfeld zeigt nun eine Reihe von Optionen an. Wählen Sie “Klicken Sie auf die Schaltfläche “Mehr laden”” und scrollen Sie dann zum Ende der Seite, bis Sie die Schaltfläche “Nächste Seite” oder etwas Ähnliches finden. Klicken Sie darauf und klicken Sie auf die Schaltfläche “Bestätigen”.

Wenn Sie mehr Daten benötigen, als Octoparse ursprünglich aufgenommen hat, können Sie ein zweites Element erstellen, das jedes Element in der Liste auswählt und die gewünschten Daten erfasst.
Gehen Sie zunächst zu einem Element in der Liste, klicken Sie darauf und wählen Sie dann die Option „URL anklicken“ aus dem Menü „Tipps“.

Die dedizierte Seite des Artikels wird nun geladen. Klicken Sie auf die entsprechenden Felder, und sie werden unten angezeigt. Sie können sie bearbeiten, wenn Sie möchten.

Führen Sie die Aufgabe aus
Wenn Sie mit der Gliederung der von Ihnen erstellten Aufgabe endgültig zufrieden sind, ist es an der Zeit, sie auf Ihrem Gerät auszuführen oder zu planen (Lokal). Es ist auch möglich, es in der Cloud auszuführen, aber das ist eine Option, die nur für diejenigen mit einem Plan verfügbar ist.

Der Prozess des Scrapings dauert nicht allzu lange, und wenn es fertig ist, können Sie sofort auf die Schaltfläche “Daten exportieren” klicken und von dort aus Ihr bevorzugtes Format auswählen.

Octoparse ist ziemlich komplex und man kann damit mehr erreichen, als nur einfache Aufgaben einzurichten. Beispiel: Verfeinern der extrahierten Daten. Mit dem RegEx-Tool in der Toolbox können Sie die Daten bereinigen, z. B. Text ersetzen.

Hallo Zapier!
Wir sollten auch beachten, dass Octoparse mit Version 8.4 seine Kräfte mit Zapier zusammengetan hat und diese Integration bedeutet, dass Benutzer den Web-Scraping-Dienst jetzt in Kombination mit Tausenden von Apps wie Google Drive, Google Sheets, Slack und anderen verwenden können.
Um mit der Integration von Workflows zu beginnen, müssen Sie auf Ihrem Gerät auf Zapier zugreifen. Klicken Sie dann auf die Schaltfläche „Create Zap“ auf der rechten Seite des Displays. Wir wollten einen Zap einrichten, der Google Drive-Dateien durch neue Dokumente ersetzt, die in Octoparse verarbeitet wurden.
Um einen Trigger einzurichten, müssen Sie die Suchleiste verwenden, um Octoparse zu suchen und auszuwählen. Verbinden Sie sich mit Ihrem Octoparse-Konto und beginnen Sie mit der Einrichtung des Triggers. Wählen Sie die Octoparse-Zielaufgabe, die Sie nach ID durchsuchen können, und legen Sie dann Ihren idealen Aufgabenstatus fest. Das Auffinden der Aufgaben-ID ist etwas schwierig, wenn Sie es zum ersten Mal tun. Glücklicherweise hat die Dokumentation Sie abgedeckt, sodass Sie es schnell herausfinden können. (Tipp: Sie müssen die Aufgabe in der Cloud ausführen.)

Als Nächstes müssen Sie die Aktions-App auswählen, in diesem Beispiel Google Docs.

In diesem Abschnitt müssen Sie mehrere Parameter definieren. Das wichtigste ist das Aktionsereignis, also stellen Sie sicher, dass Sie eine geeignete Option auswählen. Danach müssen Sie in den Feldern „Aktion einrichten“ weitere Details zur Aktion angeben.

Der Prozess erwies sich beim nächsten Mal als ziemlich reibungslos, als wir versuchten, einen neuen Zap zu erstellen. Es ist nur ein wenig gewöhnungsbedürftig. Möglicherweise müssen Sie auch ein wenig lesen. Glücklicherweise bieten sowohl Zapier als auch Octoparse ihre eigene Bibliothek mit Tutorials an, sodass Sie nicht gezwungen sind, viel Zeit in die Recherche zu investieren.
Holen Sie sich jetzt Octoparse
Sie können Octoparse kostenlos testen, was perfekt für diejenigen ist, die ein paar einfache Projekte durchführen möchten. Melden Sie sich mit einem Konto an, um loszulegen. Um jedoch Zugriff auf alle Funktionen zu erhalten, müssen Sie auf einen der drei kostenpflichtigen Pläne upgraden:
- Standardplan: 75 USD/Monat
- Professional-Plan: 209 USD/Monat
- Enterprise Plan: benutzerdefinierte Funktionen auf Anfrage verfügbar

Während Sie in der kostenlosen Version viele Dinge tun können, bieten die kostenpflichtigen Versionen erweiterte Optionen. Dazu gehören der Zugriff auf eine größere Anzahl von Crawlern, geplante Extraktionen, gleichzeitige Cloud-Extraktionen, automatische IP-Rotation, API-Zugriff, E-Mail-Support und mehr.
Wenn Sie neugierig auf Octoparse sind, können Sie zuerst die kostenlose Stufe erwerben und sehen, wie gut sie Ihren Anforderungen entspricht. Die neueste Version ist verfügbar für herunterladen jetzt auf der offiziellen Website.