Name: Building Batch Data Analytics Solutions on AWS
Price: 750 EUR

Building Batch Data Analytics Solutions on AWS (BBDAS)

Kursüberblick

In diesem Kurs lernen Sie die Erstellung von Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Apache Spark- und Apache Hadoop-Service der Enterprise-Klasse. Sie lernen, wie Amazon EMR mit Open-Source-Projekten wie Apache Hive, Hue und HBase und mit AWS-Services wie AWS Glue und AWS Lake Formation integriert wird. Der Kurs behandelt die Komponenten Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Sie lernen die Verwendung von EMR Notebooks zur Unterstützung von Analyse- und Machine Learning-Arbeitslasten. Sie werden auch lernen, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.

Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.

Zielgruppe

Dieser Kurs richtet sich an:

Ingenieure für Datenplattformen
Architekten und Betreiber, die Datenanalyse-Pipelines aufbauen und verwalten

Zertifizierungen

Empfohlenes Training für die Zertifizierung zum:

AWS Certified Data Engineer - Associate

Voraussetzungen

Teilnehmer mit mindestens einem Jahr Erfahrung im Umgang mit Open-Source-Datenframeworks wie Apache Spark oder Apache Hadoop profitieren von diesem Kurs.

Kursziele

In diesem Kurs werden Sie lernen:

Vergleichen Sie die Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen
Entwurf und Implementierung einer Lösung für die Batch-Datenanalyse
Identifizierung und Anwendung geeigneter Techniken, einschließlich Komprimierung, zur Optimierung der Datenspeicherung
Auswahl und Einsatz geeigneter Optionen zur Aufnahme, Umwandlung und Speicherung von Daten
Auswahl der geeigneten Instanz- und Knotentypen, Cluster, der automatischen Skalierung und der Netzwerktopologie für einen bestimmten geschäftlichen Anwendungsfall
Verstehen, wie sich Datenspeicherung und -verarbeitung auf die Analyse- und Visualisierungsmechanismen auswirken, die für die Gewinnung verwertbarer Geschäftseinblicke erforderlich sind
Sichere Daten im Ruhezustand und bei der Übertragung
Überwachen von Analyse-Workloads, um Probleme zu erkennen und zu beheben
Anwendung bewährter Kostenmanagementverfahren

Kursinhalt

Modul A: Überblick über Datenanalyse und die Datenpipeline

Anwendungsfälle der Datenanalyse
Nutzung der Datenpipeline für Analysen

Modul 1: Einführung in Amazon EMR

Verwendung von Amazon EMR in Analyselösungen
Amazon EMR-Cluster-Architektur
Interaktive Demo 1: Starten eines Amazon EMR-Clusters
Strategien für das Kostenmanagement

Modul 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

Speicheroptimierung mit Amazon EMR
Techniken für die Datenübernahme

Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR

Apache Spark auf Amazon EMR Anwendungsfälle
Warum Apache Spark auf Amazon EMR
Spark-Konzepte
Interaktive Demo 2: Verbinden mit einem EMR-Cluster und Ausführen von Scala-Befehlen mit der Spark-Shell
Umwandlung, Verarbeitung und Analyse
Verwendung von Notebooks mit Amazon EMR
Praxisübung 1: Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR

Modul 4: Verarbeitung und Analyse von Batch-Daten mit Amazon EMR und Apache Hive

Verwendung von Amazon EMR mit Hive zur Verarbeitung von Stapeldaten
Umwandlung, Verarbeitung und Analyse
Praxisübung 2: Batch-Datenverarbeitung mit Amazon EMR und Hive
Einführung in Apache HBase auf Amazon EMR

Modul 5: Serverlose Datenverarbeitung

Serverlose Datenverarbeitung, -umwandlung und -analyse
Verwendung von AWS Glue mit Amazon EMR-Arbeitslasten
Praxisübung 3: Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions

Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern

Sicherung von EMR-Clustern
Interaktive Demo 3: Client-seitige Verschlüsselung mit EMRFS
Überwachung und Fehlerbehebung von Amazon EMR-Clustern
Demo: Überprüfung der Apache Spark-Cluster-Historie

Modul 7: Entwurf von Batch Data Analytics-Lösungen

Anwendungsfälle der Batch-Datenanalyse
Tätigkeit: Entwurf eines Arbeitsablaufs für die Batch-Datenanalyse

Modul B: Entwicklung von modernen Datenarchitekturen auf AWS

Moderne Datenarchitekturen

Preise & Trainingsmethoden

Online Training

Dauer
1 Tag

Preis

750,– €

Termine und Buchen

Termin anfragen

Classroom Training

Dauer
1 Tag

Preis

Österreich: 750,– €
Deutschland: 750,– €
Schweiz: CHF 870,–

inkl. Verpflegung

Termine und Buchen

Termin anfragen

Instructor-led Online Training: Kursdurchführung online im virtuellen Klassenraum.

FLEX Classroom Training (Hybrid-Kurs): Kursteilnahme wahlweise vor Ort im Klassenraum oder online vom Arbeitsplatz oder von zu Hause aus.

Deutsch

Europäische Zeitzonen

11.06.2025 Online Training Kurssprache: Deutsch

14.07.2025 Online Training
Klassenraum-Option: Zürich, Schweiz

22.09.2025 Online Training
Klassenraum-Option: Zürich, Schweiz

30.09.2025 Online Training Kurssprache: Deutsch

24.11.2025 Online Training
Klassenraum-Option: Zürich, Schweiz

09.12.2025 Online Training Kurssprache: Deutsch

Englisch

Europäische Zeitzonen

23.07.2025 Online Training Kurssprache: Englisch

29.10.2025 Online Training Kurssprache: Englisch

Italienisch

Europäische Zeitzonen

15.07.2025 Online Training Kurssprache: Italienisch

21.10.2025 Online Training Kurssprache: Italienisch

FLEX Classroom Training (Hybrid-Kurs): Kursteilnahme wahlweise vor Ort im Klassenraum oder online vom Arbeitsplatz oder von zu Hause aus.

Europa

Schweiz

14.07.2025 Zürich

22.09.2025 Zürich

24.11.2025 Zürich

Mittlerer Osten

Saudi-Arabien

21.07.2025 Riad Kurssprache: Englisch

13.10.2025 Riad Kurssprache: Englisch

15.12.2025 Riad Kurssprache: Englisch

Vereinigte Arabische Emirate

21.07.2025 Dubai Kurssprache: Englisch

13.10.2025 Dubai Kurssprache: Englisch

15.12.2025 Dubai Kurssprache: Englisch

Afrika

Ägypten

05.05.2025 Kairo Kurssprache: Englisch

28.07.2025 Kairo Kurssprache: Englisch

27.10.2025 Kairo Kurssprache: Englisch