Web Scraping Basics

Zimm­Wri­ter, eine KI-basier­te Schreib­soft­ware, hat die Fähig­keit ent­wi­ckelt, Daten aus dem Inter­net zu scra­pen und in Echt­zeit zusam­men­zu­fas­sen. Nut­zer kön­nen URLs von Nach­rich­ten­ar­ti­keln oder Pro­dukt­in­for­ma­tio­nen ein­ge­ben, und die Soft­ware ver­ar­bei­tet die­se Infor­ma­tio­nen auto­ma­tisch, um bei­spiels­wei­se Social-Media-Bei­trä­ge zu erstel­len. Der Pro­zess beinhal­tet das Abru­fen von Daten durch einen soge­nann­ten “magi­schen Befehl”, der es ermög­licht, Inhal­te effi­zi­ent zu extra­hie­ren und zu nut­zen, ohne die URL erneut ein­ge­ben zu müs­sen. Zimm­Wri­ter bie­tet zudem kos­ten­güns­ti­ge Optio­nen für das Scra­ping, wobei das Zusam­men­fas­sen von umfang­rei­chen Tex­ten nur mini­ma­len Auf­wand erfor­dert. Es gibt jedoch Ein­schrän­kun­gen, wie die Unmög­lich­keit, meh­re­re URLs gleich­zei­tig zu bear­bei­ten, und gele­gent­li­che Kom­pli­ka­tio­nen beim Abru­fen von Daten, die auf die Kom­ple­xi­tät des HTML-Codes zurück­zu­füh­ren sind.

Grundlagen des Web Scraping mit ZimmWriter

Grund­la­gen des Web Scra­ping mit ZimmWriter

Zimm­Wri­ter, die KI-Schreib­soft­ware, kann jetzt Daten aus dem Inter­net zusam­men­fas­sen und scra­pen. Du kannst Daten in Echt­zeit ein­ge­ben, sei es ein Nach­rich­ten­ar­ti­kel oder Pro­dukt­in­for­ma­tio­nen von Ama­zon oder einem gro­ßen Ein­zel­händ­ler oder Her­stel­ler, und sie mit Hil­fe von KI zusam­men­fas­sen – und das alles automatisch.

Zuerst sehen wir uns an, wie man Daten mit einem magi­schen Befehl abruft. Ich wer­de dir zei­gen, wie das geht, und dann sehen wir uns den SEO Blog Edi­tor an. Ich habe den Edi­tor mit einer URL für einen CNN-Arti­kel geöff­net. Ich füge sie ein und erstel­le einen magi­schen Befehl. Nor­ma­ler­wei­se wür­de man der KI sagen, dass sie etwas tun soll, zum Bei­spiel einen Social-Media-Post über die URL schrei­ben. Jetzt geht Zimm­Wri­ter ins Inter­net, scrab­belt die Daten, fasst sie zusam­men und fügt sie in die Hin­ter­grund­in­for­ma­tio­nen für die­sen Befehl ein.

Um auf die gesam­mel­ten Infor­ma­tio­nen zu ver­wei­sen, ver­wen­de das Wort „URL“. Gib die URL nicht noch ein­mal ein, son­dern sage statt­des­sen „schrei­be einen Social-Media-Post über die­se URL“ oder „schrei­be eine Zusam­men­fas­sung über die­se URL“. So bekommst du gute Ergebnisse.

Das Scra­ping ist fast abge­schlos­sen. Zimm­Wri­ter wird zuerst die URL schrei­ben und dann unse­ren magi­schen Befehl ver­ar­bei­ten. Sobald er fer­tig ist, haben wir einen Social Media Post über die URL. Zum Bei­spiel: „Fährst du die­sen Som­mer nach Ita­li­en? Dann soll­test du unbe­dingt das Fruia Vene­dig besu­chen… Die­se Regi­on ist nicht nur reich an Kul­tur, Geschich­te und atem­be­rau­ben­der Natur­schön­heit, son­dern du kannst auch Gut­schei­ne im Wert von bis zu 350 Pfund für vie­le Attrak­tio­nen, Restau­rants und Hotels erhalten“.

Wir haben gera­de eine gan­ze Sei­te mit KI zusam­men­ge­fasst und dann einen Social-Media-Bei­trag dar­über geschrie­ben. Jetzt wol­len wir die­sen magi­schen Befehl opti­mie­ren. Wenn wir einen Face­book-Post über die URL schrei­ben wol­len, kön­nen wir sie mar­kie­ren, die Steue­rungs­tas­te drü­cken und Zimm­Wri­ter wird die Daten erneut scra­pen. Aber das brau­chen wir nicht, weil wir sie ja schon gescrapt haben. Statt­des­sen kön­nen wir die Steue­rungs­tas­te V drü­cken und die in der Zwi­schen­ab­la­ge gespei­cher­te Zusam­men­fas­sung in den Edi­tor einfügen.

Wenn wir eine Sei­te scrap­pen und einen magi­schen Befehl mit der URL ein­ge­ben, führt Zimm­Wri­ter die­sen Befehl aus und spei­chert die Zusam­men­fas­sung in der Zwi­schen­ab­la­ge. Jetzt kön­nen wir die­sen Befehl neh­men, einen Face­book-Post schrei­ben, ihn an das Ende der Zusam­men­fas­sung anhän­gen, den Befehl und die Zusam­men­fas­sung mar­kie­ren und die Steue­rungs­tas­te drü­cken. Zimm­Wri­ter muss die Sei­te nicht neu ein­le­sen, son­dern ver­ar­bei­tet nur unse­re Hintergrundinformationen.

Wenn du kei­nen magi­schen Befehl aus­füh­ren willst, kannst du auch „zusam­men­fas­sen“ und ein Gleich­heits­zei­chen ein­ge­ben, es dann mar­kie­ren und die Steue­rungs­tas­te 1 drü­cken. Zimm­Wri­ter wird dann ein­fach die Sei­te zusam­men­fas­sen und die Zusam­men­fas­sung aus­ge­ben, ohne einen wei­te­ren magi­schen Befehl auszuführen.

Hier sind eini­ge bewähr­te Metho­den, die du beach­ten solltest:

  • Das Scra­pen und Zusam­men­fas­sen erfolgt mit Tur­bo, das sehr spar­sam ist. Das Scra­pen und Zusam­men­fas­sen eines Blog­ein­trags mit 10.000 Wör­tern wür­de etwa zwei Cent kos­ten, wäh­rend ein Ein­trag mit 1.000 Wör­tern etwa einen Fünf­tel Cent kos­ten würde.
  • Mit den magi­schen Befeh­len kannst du immer nur eine URL bear­bei­ten. Du kannst nicht zwei URLs ein­ge­ben und die KI bit­ten, sie zu vergleichen.
  • Manch­mal funk­tio­niert der Scra­pe nicht oder du bekommst eine Feh­ler­mel­dung. Wenn es nicht funk­tio­niert, ist die URL viel­leicht nicht kompatibel.
  • Scra­ping ist nicht per­fekt. Die KI muss den eigent­li­chen Text aus dem HTML-Code her­aus­fil­tern, was schwie­rig sein kann.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert