Návrh Školení
Úvod
- Přehled funkcí a architektury Spark a Hadoop
- Porozumění velkým datům
- Python základy programování
Začínáme
- Nastavení Python, Spark a Hadoop
- Pochopení datových struktur v Python
- Pochopení PySpark API
- Pochopení HDFS a MapReduce
Integrace Spark a Hadoop s Python
- Implementace Spark RDD v Python
- Zpracování dat pomocí MapReduce
- Vytváření distribuovaných datových sad v HDFS
Machine Learning s Spark MLlib
Zpracování Big Data s Spark Streaming
Práce s Recommender Systems
Práce s Kafkou, Sqoopem, Kafkou a Flume
Apache Mahout se Sparkem a Hadoop
Odstraňování problémů
Shrnutí a další kroky
Požadavky
- Zkušenosti se Sparkem a Hadoop
- Python zkušenosti s programováním
Publikum
- Datoví vědci
- Vývojáři
Reference (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
The live examples