Návrh Školení
Úvod
- Apache Spark vs Hadoop MapReduce
Přehled Apache Spark Funkce a architektura
Výběr jazyka Programming
Nastavení Apache Spark
Vytvoření vzorové aplikace
Výběr souboru dat
Spuštění Data Analysis na Data
Zpracování strukturovaných dat pomocí Spark SQL
Zpracování dat streamování pomocí Spark Streaming
Integrace Apache Spark s nástroji 3. části Machine Learning
Použití Apache Spark pro zpracování grafu
Optimalizace Apache Spark
Odstraňování problémů
Shrnutí a závěr
Požadavky
- Zkušenosti s příkazovým řádkem Linuxu
- Obecná znalost zpracování dat
- Zkušenosti s programováním v Javě, Scala, Pythonu nebo R
Publikum
- Vývojáři
Reference (5)
Spousta praktických příkladů, různé způsoby, jak přistupovat ke stejnému problému, a někdy ne tak samozřejmé triky, jak stávající řešení vylepšit
Rafal - Nordea
Kurz - Apache Spark MLlib
Machine Translated
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift