Vortragender: Jesper Zedlitz
Die Arbeit mit großen Datensätzen, die aus mehrere hundert bis mehrere Millionen Zeilen bestehen, ist für viele schwierig bis unmöglich, da bei üblichen Tabellenkalkulationen bei etwa einer Million Zeilen Schluss ist. Den Überblick in so großen Datensätze zu behalten, ist auch nicht einfach. Eine Fehlersuche und das Auffinden von Anomalitäten ist von Hand quasi unmöglich.
In dem Online-Meeting möchte ich die Software OpenRefine vorstellen, mit der die Bearbeitung solch umfangreicher Datensätze relativ einfach möglich ist. An praktischen Beispielen wollen wir uns ansehen, wie man mit OpenRefine Fehler in riesigen Tabellen sucht und aus auf ersten Blick chaotischen Texten strukturierte Daten in Tabellenform extrahiert.
Zoom-Meeting beitreten
https://zoom.us/j/94490284708?pwd=R2FTdFpldFRNb...
Meeting-ID: 944 9028 4708
Kenncode: 943467
Wird der Vortrag aufgenommen, sodass man sie später nachschauen kann?