Inhaltsverzeichnis
ToggleKernfunktionalität
🔍der Scraping Surgeon in der ZimmWriter AI ermöglicht es den Nutzern, das Gehirn der KI mit bestimmten Webinhalten zu füttern, um hochwertige Artikel und Rezensionen zu erstellen.
Technische Umsetzung
🖥️Nutzer müssen Domain-, Titel-, Bild- und Textselektoren (z. B. #product-title, #image-wrapper) angeben, um gezielte Informationen aus Webseiten zu extrahieren.
🏷️Verwende beim Scraping # für IDs und . für Klassen in CSS-Selektoren, da IDs eindeutig sind, während Klassen mehrfach auf einer Seite vorkommen können.
Plattformspezifische Strategien
🛒Bei Amazon-Seiten konzentriere dich auf die Identifizierung von Produkttitel- und Bildselektoren, um zu vermeiden, dass fremde Informationen unter nicht verwandten Abschnitten versteckt werden.
🚀die AppSumo-Seiten sind besser strukturiert und ermöglichen eine einfachere Extraktion von Produktdetails und -listen mit spezifischen CSS-Selektoren.
Scraping Surgeon näher betrachtet (Amazon & AppSumo Beispiele)
Ich möchte dir eine brandneue Funktion in Zimmerer: Scraping Surgeon. Es gibt dir eine Macht, die du noch nie zuvor hattest, und es ist eine wahnsinnige Macht – wie der Infinity Gauntlet von Marvel-Superheld Thor. Das ist sehr mächtig. Ich werde es dir zeigen, aber zuerst möchte ich dir einen Überblick darüber geben, was es ist und warum es wichtig ist.
Wenn du nicht weißt, was ZimmWriter ist, dann ist es meiner Meinung nach die beste KI-Schreibsoftware der Welt, weil ich sie entwickelt habe. Wenn du noch keine Lizenz hast, findest du unten einen Link, den du unbedingt ausprobieren solltest. Es gibt viele Stellen in ZimmWriter, an denen wir die KI Inhalte aus dem Internet verwenden lassen können, um ihr Gehirn zu füllen und dann darüber zu schreiben.
In Penny Arcade zum Beispiel können wir bis zu tausend URLs eingeben und die KI darüber schreiben lassen. Man kann Videos eingeben und die KI schreibt dann einen ganzen Blogbeitrag auf der Grundlage des Transkripts. Du kannst Amazon-Produkte oder Amazon-Links eingeben und die KI schreibt einen ganzen Blogbeitrag über das Produkt, mit Bild, Handlungsaufforderung und sogar einem Affiliate-Tag. Du kannst die URLs deiner Konkurrenten eingeben, deine eigenen URLs oder jede andere URL, die dir in den Sinn kommt, und für jede URL, die du eingibst – bis zu tausend – schreibt ZimmWriter einen Blogbeitrag für dich.
Das ist ein Ort, an dem du die KI ins Internet gehen lassen kannst, um Daten abzurufen und zu bearbeiten. Das kannst du auch im SEO Writer tun. Im SEO Writer kannst du für jede deiner Überschriften eine URL eingeben, was viele Leute benutzen, um eine Zusammenfassung zu schreiben. Vielleicht möchtest du „Die 10 besten Grills für 2023“ schreiben. Das kannst du tun, indem du 10 verschiedene URLs für Amazon eingibst und einfach eine hochwertige Produktübersicht schreibst.
Eine andere Möglichkeit ist der Bulk Writer. Du kannst auf SEO CSV klicken und eine CSV-Datei hochladen, die tausende verschiedene Blogbeiträge mit Hintergrundinformationen und verschiedenen URLs enthält, die die KI scannen soll. Es gibt viele Möglichkeiten, dies zu tun. Der letzte Ort, an dem du sie verwenden kannst, ist in einem Notizblock oder Editor. Du kannst „zusammenfassen“ und ein Gleichheitszeichen eingeben und dann eine URL abrufen.
Ich habe zum Beispiel diese Saftbox, die ich für meinen Sohn gekauft habe. Ich markiere alles, klicke auf „Prüfen“ und lasse es zusammenfassen. Ich habe diese Saftboxen für meinen Sohn gekauft und sie sind wirklich gut. Ich packe sie in sein Pausenbrot. Wir können die KI eine Zusammenfassung darüber schreiben lassen, aber eines der Probleme ist, dass es viele verschiedene Orte gibt, an denen wir die KI Daten aus dem Internet zusammenfassen lassen können.
Eines der größten Probleme ist, dass einige dieser Seiten, wie die von Amazon, eine Menge irrelevanter Informationen enthalten, die wir nicht wirklich brauchen. Auf dieser Seite haben wir den Titel des Produkts, ein Foto und einige Details, aber dann gibt es eine Menge Dinge, die sich nicht speziell auf dieses Produkt beziehen. Wir haben zum Beispiel Energy Drinks. Ich werde meinem Sechstklässler in der Schule keinen Energydrink geben – die Lehrer würden mich umbringen. Wir haben auch andere Getränke und Sägeblätter – ich gebe meinem Kind kein Sägeblatt für sein Pausenbrot mit. Wir haben eine Katze, aber mein Kind könnte etwas Bewegung gebrauchen. Es gibt ein Katzenrad, von dem wir uns Anregungen holen könnten. Der Punkt ist, dass es viele Dinge gibt, die wir nicht brauchen. Wir wollen nur bestimmte Dinge für die KI, damit sie die Daten zusammenfassen kann.
Diese Zusammenfassung ist wirklich gut geworden, weil wir etwas namens Scraping Surgeon verwenden. In ZimmWriter klickst du auf das Optionsmenü und konfigurierst Scraping Surgeon. Dazu musst du deinen API-Schlüssel einrichten. Dazu klickst du auf „Scraping einrichten“ und kannst deinen API-Schlüssel ganz einfach einrichten. Bevor wir darüber sprechen, wie das funktioniert, sollten wir ein paar allgemeine Informationen besprechen. Je nach deinen technischen Kenntnissen ist das vielleicht ein bisschen zu viel für dich, aber ich werde dir ein paar Dinge erklären. Zunächst einmal ist das, was wir besprechen werden, nicht schwierig. Es ist nicht schwer, das zu lernen. Zweitens: Wenn du diese Dinge lernst, bist du viel weiter als deine Konkurrenten.
Du kannst alles über Scraping Surgeon im Handbuch nachlesen. Wir geben dir eine Einführung in HTML und CSS und erklären dir, wie du dieses Tool benutzen kannst. Ich gebe dir einen groben Überblick über die Benutzung des Tools, aber wenn du tiefer eintauchen möchtest, klicke auf den Link und lies den ultimativen Leitfaden.
In ZimmWriter haben wir bereits ein Amazon-Profil hochgeladen und eingerichtet. Ich habe das gemacht, weil es viele Affiliate Marketer gibt. Als erstes muss man seine Domain eingeben, also Amazon dot – wir müssen nicht die ganze Domain eingeben, weil es noch andere Amazon-Domains gibt, wie amazon.co.uk, amazon.in und amazon.jp. Wenn wir es bei „amazon.“ belassen, können wir alles abdecken.
Als nächstes müssen wir den Titel des Produkts finden. Dazu müssen wir die CSS-Klasse oder ID oder das HTML-Tag H1 oder H2 für den Titel finden. In Chrome kannst du F12 drücken, um die HTML-Konsole zu öffnen, die dir alle verschiedenen HTML-Elemente der Seite anzeigt. Es gibt einen kleinen Pfeil, den du drücken kannst, um den Titel des Produkts zu markieren oder mit der Maus darüber zu fahren. Wenn du darauf klickst, wird der HTML-Code an der entsprechenden Stelle eingefügt. Ich habe meine Hausaufgaben gemacht und „Produkttitel“ ausgewählt, und wenn wir uns den HTML-Code ansehen, sehen wir, dass der Produkttitel in einem Span-Tag mit der ID „Produkttitel“ steht.
Wenn man auf den Code außerhalb des HTML-Codes verweist, verlangt die CSS-Nomenklatur, dass man ein Hashtag vor die ID und einen Punkt vor die Klasse setzt. In diesem Fall beziehen wir uns auf eine ID, also setzen wir ein Hashtag vor „Produkttitel“. Der Unterschied zwischen einer ID und einer Klasse ist, dass eine ID nur einmal auf der Seite vorkommt, während eine Klasse unendlich oft vorkommen kann. Wenn wir Elemente identifizieren, sollten wir nach Möglichkeit IDs verwenden.
Jetzt haben wir unsere ID für das Produkt, aber wir wollen auch überprüfen, ob diese ID bei mehreren Produkten auf Amazon gleich ist. Auf diese Weise können wir feststellen, ob es sich wirklich um eine ID handelt, die Amazon verwendet, um den Titel zu identifizieren, oder nicht.
Wenn du möchtest, kannst du das Bild leer lassen. Wenn du es aber ausfüllst, lädt ZimmWriter das Bild herunter, ändert die Größe und macht andere coole Sachen. Wenn du eine Verbindung zu WordPress herstellst, wird das Bild sogar als Featured Image oder Inline Block Image hochgeladen. Es ist wichtig, dass du dich an alle Copyright-Regeln hältst. Wenn du dich damit nicht wohl fühlst, kannst du das Bild leer lassen und es selbst bearbeiten. Du kannst die URL einbetten oder deine eigene Amazon API verwenden.
Kurz gesagt: Wenn du dieses Feld leer lässt, wird das Bild nicht abgeholt, andernfalls kannst du es finden. Wir zeigen dir hier, wie wir das Bild gefunden haben. Wir verwenden die Wrapper-ID des Bild-Tags, und wenn du dich erinnerst, bedeutet der Hashtag, dass es sich um eine ID handelt. Mal sehen, ob wir es finden können.
Es gibt ein Div, das dieses Bild-Tag umgibt, also klappen wir es ein. Man sieht, dass sich das Image-Tag innerhalb dieses Divs und der ID befindet. IDs sind gut; die Wrapper-ID für das Bild-Tag klingt perfekt, also verwenden wir sie für unser Bild. Dann kann man bis zu fünf CSS-Klassen oder IDs in HTML-Tags angeben, und das sind die einzelnen HTML-Tags, aus denen man wählen kann, bis zu fünf durch Komma getrennte, um die verschiedenen Texte auf der Seite zu identifizieren.
Ich werde nicht auf jeden einzelnen eingehen, aber kurz gesagt, ich habe einen Text gefunden, der den Inhalt hier drüben darstellt, dann die Produktdetails, und dann habe ich festgestellt, dass verschiedene Produkte verschiedene Bereiche hier unten haben. Also habe ich einige dieser verschiedenen Bereiche eingefügt. Du wirst das nicht bei jedem einzelnen Produkt sehen, aber es wird die meisten Produkte auf Amazon abdecken.
Dann kannst du hier unten deinen Affiliate-Code eingeben. Das ist ganz einfach, du musst keine Fragezeichen oder ähnliches für Amazon eingeben. Du gibst einfach deinen Code hier ein und dann hast du zwei Checkboxen: Als Rezension behandeln und Aktivieren. Lass uns zuerst über das hier sprechen. Wenn du diese Option aktivierst, wird Zimwriter jedes Mal, wenn es Amazon scrapen will, den Scraping Surgeon verwenden, d.h. es wird nur die Daten abrufen, die wir hier angegeben haben.
Wenn wir ihn also deaktivieren, wird er das nicht mehr tun. Wenn du einen Amazon-Link in Penny Arcade einfügst und du hast einen Link zu einem Produkt, dann wird das wie eine Rezension behandelt. Lass mich das erklären – du hast nur einen Link zu einem Produkt, wie soll der Titel lauten? Soll der Titel einfach „Arizona Mucho Mango Drink 6,75 fluid ounces“ lauten? Das wollen wir nicht, das wäre ein blöder Blogpost-Titel.
Wahrscheinlich schreibst du eine Produktrezension. Wenn du also einen Scraping Chirurgen benutzt, um etwas zu identifizieren, das als Produkt klassifiziert ist – alles, was auf Amazon angeboten wird, ist ein Produkt -, dann solltest du es als Produktbericht kennzeichnen. Wenn du dann Penny Arcade verwendest, wird der Artikel als Rezension betitelt, wahrscheinlich mit dem Wort Rezension, wie Arizona Mucho Mango Drink Review oder so ähnlich.
Wenn du das weglässt, wird es nicht funktionieren. Du musst den Scraping Surgeon nicht nur für Produkte verwenden, aber wenn du dich für eine bestimmte Domain entscheidest, die hauptsächlich Produkte hat, die du für Produkte scrapen wirst, solltest du das überprüfen, wenn du vorhast, sie für Penny Arcade zu verwenden. Im Moment gilt das nur für Penny Arcade.
Fangen wir noch einmal von vorne an. Gehe zu „Keine“ und lösche das, um AppSumo zu verwenden. Wenn du nicht weißt, was AppSumo ist, ist es ein großartiger Ort, um tolle Angebote zu finden. Es gibt viele Affiliate-Vermarkter, die AppSumo-Produkte bewerben. Man meldet sich bei AppSumo an, bekommt einen Affiliate-Code und schreibt dann Bewertungen über diese Produkte.
Ich zeige dir, wie das ganz schnell geht. Wir drücken F12 und schreiben ganz schnell eine Bewertung. Auch hier gilt: Wenn du AppSumo nur für eine URL verwendest, solltest du nicht unbedingt den Scraping Surgeon verwenden. Wenn du vorhast, AppSumo häufig zu verwenden, solltest du dir die Zeit nehmen, es einzurichten. Zuerst brauchen wir unsere Domain, also appsumo.com. Dann brauchen wir unseren Titel, gehen wir hier rüber. Unser Titel hier ist H1.
Ich habe nachgeschaut und es gibt nicht wirklich viele andere H1s; es gibt ein paar hier, aber sie sind alle repräsentativ für den Titel. Hier ist noch einmal der Titel und hier nicht, aber ich habe vor dem Video ein paar Tests gemacht, und das wird funktionieren. Also fügen wir hier H1 ein. Dann brauchen wir das Bild, also gehen wir hier rüber und suchen das Bild. Hier sind ein paar Bilder drin, hier ist ein Karussell. Wir gehen hier hoch und schauen, was wir finden – Karussell-Rapper; das könnte nicht schlecht sein; oh, Bild Karussell – perfekt.
Ich denke, wir machen jetzt eine Suche danach, weil wir ein Bilderkarussell machen. Es gibt nur ein Bilderkarussell in der ganzen Sache, also könnte Bilderkarussell eine gute Wahl sein, auch wenn es eine Klasse ist. Es gibt diesen PDP Abschnitt Carousel und natürlich wird er zweimal verwendet, also weiß ich nicht, ob das gut ist oder nicht. Nehmen wir das Klassenbild Carousel, probieren wir es aus. Das ist eine Klasse, also machen wir einen Punkt und fügen das hier ein.
Dann brauchen wir bis zu fünf CSS-Klassen, IDs oder HTML-Tags, und das sind die Möglichkeiten, aus denen wir wählen können. Ich habe meine Hausaufgaben vor diesem Video gemacht und das Problem auf dieser Seite ist, dass es wirklich keine guten CSS-Klassen und IDs gibt, um den Inhalt auf dieser Seite zu identifizieren. Es gibt eine Menge Zeug, das einfach nicht hilfreich ist. Also einen Schritt zurücktreten und einen Moment darüber nachdenken. Amazon unterscheidet sich von AppSumo insofern, als dass eine Amazon-Seite über viele verschiedene Produkte spricht, vielleicht über verwandte Produkte, über Produkte, die andere auch gekauft haben, oder über völlig unterschiedliche Produkte, wie ein Sägeblatt, das völlig anders ist als ein Juice Boxx-Getränk.
Bei AppSumo hingegen bezieht sich alles auf dieser Seite auf dieses Produkt. Was auch immer wir suchen, wir werden keine irrelevanten Informationen finden. Davor müssen wir uns nicht fürchten.
Wir können also einen Teil dieses Textes auswählen und sehen, dass er sich in einem Paragraph-Tag befindet. Ich füge hier einfach ein „p“ ein. Das ist ein HTML-Tag für Absatz. Ich brauche keinen Punkt davor und auch kein Hashtag. Wir machen kein CSS, das ist nur HTML. Wir könnten CSS in Klassen und IDs verwenden, aber das werden wir nicht tun, denn nach meinen Recherchen gibt es hier wirklich keine guten Klassen. Also nehmen wir „p“ für Absatz.
Es gibt auch einige Listen. Wenn man nach unten scrollt, findet man einige interessante Listen. Das sind alles gute Sachen, aber das sind keine Absätze, das sind alles Listen. Also nehmen wir das auch auf. Wir machen hier ein Komma und schreiben „Li“. Ich habe kein Partnerprogramm eingerichtet und das ist auch in Ordnung. Wir klicken auf das Kästchen „Als Verifizierung behandeln“ und speichern das Ganze als neue Domain. Jetzt ist AppSumo registriert.
Es gibt noch eine Sache, die wir mit AppSumo machen müssen. Wenn du nach unten scrollst, siehst du, was mit den Bildern passiert. Sie erscheinen. Wir versuchen es noch einmal. Sie erscheinen und wir versuchen, sie magisch aussehen zu lassen. Viele dieser Bilder werden langsam geladen, und wenn du nicht weißt, was das bedeutet, werden sie nicht in den HTML-Code geladen; sie werden erst sichtbar, wenn du auf der Seite nach unten scrollst. Wenn du also feststellst, dass du die Daten nicht bekommst, wenn du versuchst, eine Seite zu scrapen, bedeutet das, dass nicht genügend Informationen zum Scrapen vorhanden sind. Das kann zwei Dinge bedeuten: Entweder sind dein HTML-Code, deine CSS-Klassen und IDs oder die HTML-Tags, die du identifiziert hast, keine gute Wahl, oder die Domain benötigt entweder JavaScript-Rendering, Lazy Loading oder vielleicht sogar Premium-Proxies.
All diese Dinge kosten mehr Scrape-Out-Credits, also benutze AppSumo nicht einfach überall, weil es dich am Ende mehr kosten könnte. Aber ich habe es ausprobiert und es benötigt nur ein „Lazy Loading“. Das sind fünf zusätzliche Credits oder fünf Credits pro Scrape, keine große Sache. Man muss Geld ausgeben, um Geld zu verdienen. Aber es ist ein unglaublich gutes Angebot – du bekommst 10.000 Credits für fünf Dollar im Monat.
So, jetzt ist alles vorbereitet. Jetzt probieren wir mal, ob wir die Zusammenfassung und das Bild bekommen. Ich nehme diese URL, gehe zu Penny Arcade und füge sie hier ein. Jetzt gibt es eine neue Funktion in Penny Arcade, die „nur zusammenfassen“ heißt. Sie sammelt alle URLs und erstellt für jede einen Artikel – keinen Blogpost, sondern eine Datei. Wir nennen es AppSumo. Schau, was passiert.
Wir könnten hier eine Zusammenfassung machen, aber das Problem ist, dass das erstens nicht massentauglich ist und zweitens, dass man das Bild nicht bekommt; man kann nicht sehen, ob es tatsächlich das Bild hier drin erfasst hat. Es gibt also verschiedene Anwendungsfälle. Unser Output-Ordner – warten wir, bis das hier fertig ist. So kannst du schnell und effizient überprüfen, ob du die richtigen Daten mit deinen HTML- und CSS-IDs und Tags erfasst hast.
Das ist es, AppSumo 01. Wir haben den Jobnamen „AppSumo“ vorangestellt – so haben wir ihn genannt – und dann steht da Nummer eins, Nummer zwei, für so viele URLs, wie du eingegeben hast. Cool. Okay, wir haben also unsere URL; die Zusammenfassung hat uns einen fünftel Penny gekostet. Hier ist die Bild-URL; schauen wir sie uns an. Da ist es; sieht ziemlich cool aus. Und hier ist die Zusammenfassung. Ja, die Zusammenfassung ist eine KI-Zusammenfassung; sie wird jedes Mal anders aussehen, aber es sieht so aus, als würden wir gute Sachen erfassen.
Also lasst uns noch etwas tun. Schreiben wir einen Blogeintrag und laden ihn automatisch auf meine Website hoch. Zurück zu Penny Arcade, ich werde ihn dort einfügen. Ich mache 5H, Zweier, Larry, Listen, Tabellen. Wir schreiben in der ersten Person Singular und nehmen die wichtigsten Erkenntnisse mit. Ich will kurze Antworten, im Auto-Stil. Wir wollen keine Bild-API, weil ich den Tag drin lasse, um das Bild zu holen. Beachte alle Copyright-Gesetze und Regeln und so weiter, das ist deine Sache. Aber für den Test lassen wir das einfach drin und wählen unsere WordPress-Seite aus. Du kannst bis zu 10 verschiedene WordPress-Seiten in ZimmWriter verlinken und dann einfach zwischen ihnen wechseln, wann immer du willst. Und wir stellen das hier als Entwurf ein.
Mal sehen, wie es mit YouTube-Videos aussieht. Ich weiß nicht, ob es ein YouTube-Video von Sessions gibt, aber wir werden es versuchen. Wir lassen die KI versuchen, ein YouTube-Video zu finden, und ich glaube, das ist es. Wir klicken auf Penny Arcade starten. Wenn das Video fertig ist, wird es automatisch hier hochgeladen. Ich halte jetzt die Klappe, wir lassen das Ding laufen und sehen uns das Ergebnis an, wenn es fertig ist.
Der Artikel ist fertig, lass uns die Seite aktualisieren und überprüfen. Klick auf Vorschau und da ist es. Es hat unser Bild gezogen – Sessions: Ein umfassender Überblick über das ultimative Meeting-Tool. Schau es dir an. Unser Inhaltsverzeichnis – das ist ein Plugin für WordPress, es heißt Lucky Table of Contents oder so ähnlich und ist völlig kostenlos. Das sind unsere wichtigsten Ergebnisse, Pro. Vielleicht hätte ich kein YouTube-Video dafür machen sollen, weil es so aussieht, als ob es nicht ganz zusammenpasst. Ich kann es einfach bearbeiten und herausnehmen. Für einige dieser AppSumo-Produkte sind YouTube-Videos ein Volltreffer, aber wenn man darüber spricht, wie man einen Hund beobachtet, hat man mit einem relevanten YouTube-Video viel mehr Glück.
Das ist großartig: Es zieht die Details aus den Lizenzstufen und so weiter – eine tiefe Analyse, fantastisch. Siehst du, wie einfach es ist, eine wirklich coole Analyse für ein paar Cent zu machen? Das war eigentlich – ich habe vergessen, es dir zu zeigen – mal sehen, wie viel es gekostet hat. Das ist das eigentliche Textdokument;