Bad Data/Good Data. Daten reinigen mit Open Refine

Veranstaltungsdaten

21. Juni 2019 13:00 – 21. Juni 2019 16:00

Universitätsbibliothek Deutschhausstraße 9, Schulungsraum EG

Arbeiten mit mehr oder weniger strukturierten Daten gehört auch in den Geisteswissenschaften zum Arbeitsalltag. Oft eignen sich die Daten aber nur zur manuellen Bearbeitung, da sie noch zu „unsauber“ sind. Im Workshop lernen Sie mit Open Refine „unsaubere“ Datensätze für die automatisierte Datenanalyse vorzubereiten: z.B. Duplikate entfernen, vermischte Werte auf mehrere Zellen aufteilen, zusammengehörige Daten gruppieren, unterschiedliche Benennungen vereinheitlichen u.v.m.

Voraussetzungen

Senn Sie Ihren eigenen Rechner mitbringen (Laptop, Macbook, ...), installieren Sie vor dem Workshop die benötigten Programme:

  • OpenRefine (download)
  • OpenRefine benötigt eine aktuelle Java-Version (download)
  • OpenRefine empfiehlt Chrome oder Firefox als Browser

Bitte stellen Sie vor Beginn der Workshops sicher, dass Sie sich ins WLAN (über Ihren HRZ-Account oder über Eduroam) einloggen können. Wenn Sie Probleme mit dem Zugang haben, können Sie sich beim HRZ-Helpdesk im Medienzentrum der UB (1. OG) helfen lassen.

Anmeldung

Melden Sie sich bitte vor dem Workshop an (Kontaktdaten s.u.).

Referierende

Dr. Timo Glaser, Universitätsbibliothek

Kontakt