Detaillierter Kursinhalt
Thema 1 - Analyse-Workflow
- Definieren Sie Begriffe aus den Bereichen Analytik und Datenwissenschaft
- Beschreiben Sie den Arbeitsablauf für die Analyse
- Beschreiben Sie gängige Nutzungsszenarien
- Splunk Machine Learning Toolkit navigieren
Thema 2 - Explorative Datenanalyse
- Beschreiben Sie den Zweck der Datenexploration
- SPL-Befehle für die Datenexploration zu identifizieren
- Aufteilung der Daten für Test und Training mit dem Befehl sample
Thema 3 - Vorhersage numerischer Felder mit Regression
- Unterscheiden Sie Vorhersagen von Schätzungen
- Identifizierung von Vorhersagealgorithmen und Annahmen
- Beschreiben Sie die Passform und wenden Sie Befehle an
- Modellierung numerischer Vorhersagen in MLTK und Splunk Enterprise
- Verwenden Sie den Befehl score, um Modelle zu bewerten
Thema 4 - Bereinigen und Vorverarbeiten der Daten
- Definition der Vorverarbeitung und Beschreibung ihres Zwecks
- Beschreiben Sie Algorithmen, die Daten für die Verwendung in Modellen vorverarbeiten
- Verwenden Sie FieldSector, um relevante Felder auszuwählen
- Verwendung von PCA und ICA zur Reduzierung der Dimensionalität
- Daten mit StandardScaler und RobustScaler normalisieren
- Vorverarbeitung von Text mit Imputer, NPR, TF-IDF, HashingVectorizer und dem Befehl cluster
Thema 5 - Clusterdaten
- Define Clustering
- Identifizierung von Clustermethoden, Algorithmen und Anwendungsfällen
- Verwenden Sie den Smart Clustering Assistant zum Clustern von Daten
- Bewertung von Clustern anhand der Silhouettenbewertung
- Prüfen Sie die Kohärenz von Clustern
- Beschreiben Sie die besten Praktiken für Clustering
Thema 6 - Erkennung von Anomalien
- Definition von Anomalieerkennung und Ausreißern
- Identifizierung von Anwendungsfällen für die Erkennung von Anomalien
- Verwendung des Splunk Machine Learning ToolKit Smart Outlier Assistant
- Erkennen von Anomalien mit dem Algorithmus der Dichtefunktion
- Optimierung der Anomalieerkennung mit lokalem Ausreißerfaktor
- Ergebnisse mit der Visualisierung "Verteilungsdiagramm" anzeigen
Thema 7 - Schätzung und Vorhersage
- Unterscheiden Sie Vorhersagen von Prognosen
- Verwenden Sie den Smart Forecasting Assistant
- Verwendung des StateSpaceForecast-Algorithmus
- Multivariate Daten prognostizieren
- Berücksichtigung der Periodizität in jeder Zeitreihe
Thema 8 - Klassifizierung
- Definieren Sie wichtige Klassifizierungsbegriffe
- Klassifizierungsalgorithmen verwenden
- AutoPrediction
- LogistischeRegression
- SVM (Support-Vektor-Maschinen)
- RandomForestClassifier
- Bewertung von Kompromissen bei Klassifikatoren
- Auswertung der Ergebnisse mehrerer Algorithmen