Accelerating Data Engineering Pipelines (ADEP) – Details

Detaillierter Kursinhalt

Einführung

  • Treffen Sie den Ausbilder.
  • Erstellen Sie ein Konto unter courses.nvidia.com/join

Daten auf der Hardware-Ebene

  • Erforschung der Stärken und Schwächen verschiedener Hardwareansätze für Daten und der sie unterstützenden Rahmenwerke:
    • Pandas
    • CuDF
    • Dask

ETL mit NVTabular

  • Erfahren Sie, wie Sie eine ETL-Pipeline mit NVTabular aus der Perspektive eines Big-Data-Empfehlungssystems von einer auf viele GPUs skalieren können.
    • Umwandlung von Json-Rohdaten in analysefähige Parquet-Dateien
    • Lernen Sie, wie Sie schnell Funktionen zu einem Datensatz hinzufügen können, z. B. Kategorisieren und Lambda-Operatoren

Datenvisualisierung

  • Schlüpfen Sie in die Rolle eines Meteorologen und lernen Sie, wie man Niederschlagsdaten auf einer Karte darstellt.
  • Lernen Sie, wie man deskriptive Statistiken und Diagramme wie Histogramme verwendet, um die Datenqualität zu bewerten
  • Lernen Sie die effektive Speichernutzung kennen, so dass Benutzer Daten schnell über eine grafische Oberfläche filtern können.

Abschlussprojekt: Datendetektiv

  • Die Benutzer beschweren sich, dass das Dashboard zu langsam ist. Wenden Sie die im Unterricht erlernten Techniken an, um Effizienzgewinne im Backend-Code zu finden und zu beseitigen.

Abschlussbericht

  • Besprechen Sie die wichtigsten Erkenntnisse und beantworten Sie Fragen.
  • Schließen Sie die Bewertung ab und erwerben Sie Ihr Zertifikat.
  • Füllen Sie die Workshop-Umfrage aus.
  • Erfahren Sie, wie Sie Ihre eigene Entwicklungsumgebung für KI-Anwendungen einrichten können.