Einführung Webscraping

Veranstaltungsdaten

16. Januar 2019 14:00 – 16. Januar 2019 17:00

Universitätsbibliothek Deutschhausstraße 9, Gruppenraum Nr. 50

Oft liegen benötigte Daten oder Informationen nicht sauber strukturiert als csv-Datei zum Download vor, sondern sind über Webseiten verteilt. Mit Webscraping und ein wenig HTML-Kenntnissen kann man diese Informationen aus den Webseiten extrahieren und in ein nachnutzbares Format (z.B. eine Tabelle) überführen. 

In diesem Workshop werden Grundlagen von HTML und der Abfragesprache XPath vermittelt und in Webscraping-Techniken mit Scraper, einer Chrome-Extension eingeführt

Inhalte des Workshops:

  • HTML-Grundlagen, 
  • Abfragesprache XPath (XML Path Language),
  • Webscraping-Techniken.

Voraussetzungen

Bitte bringen Sie Ihren eigenen Rechner mit (Laptop, Macbook, ...) und installieren Sie vor dem Workshop die benötigten Programme:

Wenn Sie Hilfe zur Installation brauchen, können Sie vor den Workshops ab 13:00 Uhr ins DHLL oder zum Open Space im Gruppenraum 50 kommen.

Bitte stellen Sie vor Beginn der Workshops sicher, dass Sie sich ins WLAN (über Ihren HRZ-Account oder über Eduroam) einloggen können. Wenn Sie Probleme mit dem Zugang haben, können Sie sich beim HRZ-Helpdesk im Medienzentrum der UB (1. OG) helfen lassen.

Anmeldung

Melden Sie sich bitte vor dem Workshop an (Kontaktdaten s.u.).

Wenn Sie sich anmelden, geben Sie uns noch ein paar Infos mit:

  • Was für ein Rechner und Betriebssystem bringen Sie mit?
  • Haben Sie schon Vorkenntnisse in dem Thema?
  • Was studieren Sie?

Weitere Informationen zum Learning Lab finden Sie auf der Seite "Wie funktioniert das Lab?"

Referierende

Dr. Timo Glaser, Universitätsbibliothek

Kontakt