Návrh Školení
Úvod
Přehled přístupů k datům (Hive, databáze atd.)
Přehled funkcí a architektury Spark
Instalace a konfigurace Spark
Pochopení datových rámců ve Sparku
Definování tabulek a import datových sad
Dotazování datových rámců pomocí SQL
Provádění agregací, JOINů a vnořených dotazů
Nahrávání a Accessodesílání dat
Dotazování na různé typy dat
- JSON, Parkety atd.
Dotazování Data Lakes pomocí SQL
Odstraňování problémů
Shrnutí a závěr
Požadavky
- Zkušenosti s SQL dotazy
- Zkušenosti s programováním v jakémkoli jazyce
Publikum
- Datové analytiky
- Datoví vědci
- Datoví inženýři
Reference (5)
Spousta praktických příkladů, různé způsoby, jak přistupovat ke stejnému problému, a někdy ne tak samozřejmé triky, jak stávající řešení vylepšit
Rafal - Nordea
Kurz - Apache Spark MLlib
Machine Translated
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
practice tasks