Windows Server 2016 - MOC 20775 - Performing Data Engineering on Microsoft HDInsight

Standort:

Termin:

2.400,00 € *

zzgl. MwSt.

Preis inkl. gesetzlicher MwSt.: 2.856,00 €
MOC 20775 - Performing Data Engineering on Microsoft HDInsight Angesprochener Teilnehmerkreis:... mehr

MOC 20775 - Performing Data Engineering on Microsoft HDInsight

Angesprochener Teilnehmerkreis: Dateningenieure, Datenarchitekten, Datenwissenschaftler und Entwickler.
Zielsetzung: Mit dem Abschluss dieses Seminars sind die Teilnehmer in der Lage, Big Data-Workflows auf HDInsight zu planen und zu implementieren und zu warten.
Das Seminar dient auch zur Vorbereitung auf die Prüfung 70-775 bzw. zur Zertifizierung als Microsoft Certified Solutions Expert (MCSE): Data Management and Analytics.
Dieses Seminar führen wir in Kooperation mit der cmt Computer- & Management Trainings GmbH mit zertifizierten Trainern durch.
Hinweis: Das Seminar ist noch in der Entwicklung. Die Freigabe wird voraussichtlich Ende Juli 17 / August 17 erfolgen.

Inhalt

Einführung in HDInsight (Big Data, Hadoop, MapReduce, HDInsight)
Bereitstellung von HDInsight-Clustern (HDInsight-Clustertypen, Verwaltung von HDInsight-Clustern, Verwaltung von HDInsight-Clustern mit PowerShell)
Berechtigung von Benutzern für den Zugriff auf Ressourcen
Laden von Daten in HDInsight (HDInsight-Speicher, Tools für das Laden von Daten, Performance und Verlässlichkeit)
Troubleshooting von HDInsight (Analyse von HDInsight-Protokollen, YARN-Protokolle, Heap Dumps, Operations Management Suite)
Implementierung von Batch-Lösungen (Apache-Hive-Speicher, Abfragen mit Hive und Pig, Operationalisieren von HDInsight
Design von Batch-ETL-Lösungen für Big Data mit Spark
Datenanalyse mit Spark SQL
Datenanalyse mit Hive und Phoenix
Azure Stream Analytics
Spark Streaming mithilfe der DStream API
Entwicklung von Lösungen für die Echtzeitverarbeitung von Big Data mit Apache Storm

Voraussetzungen

Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen, Kenntnisse über gängige statistische Methoden und Best Practices für die Datenanalyse, Grundkenntnisse über das Microsoft-Windows-Betriebssystem und seine Kernfunktionalität, praktische Erfahrung mit relationalen Datenbanken.

Zielgruppe

Zielgruppe sind Dateningenieure, Datenarchitekten, Datenwissenschaftler und Entwickler.

Zielsetzung

Planung und Implementierung von Data Workflows auf HDInsight.