• von 20:00 bis 22:00 Uhr (Europe/Berlin)

  • Vortragender: Jesper Zedlitz

    Die Arbeit mit großen Datensätzen, die aus mehrere hundert bis mehrere Millionen Zeilen bestehen, ist für viele schwierig bis unmöglich, da bei üblichen Tabellenkalkulationen bei etwa einer Million Zeilen Schluss ist. Den Überblick in so großen Datensätze zu behalten, ist auch nicht einfach. Eine Fehlersuche und das Auffinden von Anomalitäten ist von Hand quasi unmöglich.

    In dem Online-Meeting möchte ich die Software OpenRefine vorstellen, mit der die Bearbeitung solch umfangreicher Datensätze relativ einfach möglich ist. An praktischen Beispielen wollen wir uns ansehen, wie man mit OpenRefine Fehler in riesigen Tabellen sucht und aus auf ersten Blick chaotischen Texten strukturierte Daten in Tabellenform extrahiert.

    Zoom-Meeting beitreten
    https://zoom.us/j/94490284708?pwd=R2FTdFpldFRNb...

    Meeting-ID: 944 9028 4708
    Kenncode: 943467

Merken Gemerkt
    1. 2 Kommentare
  • Markus

    Wird der Vortrag aufgenommen, sodass man sie später nachschauen kann?