Návrh Školení

Úvod

  • Přehled funkcí a architektury Spark a Hadoop
  • Porozumění velkým datům
  • Python základy programování

Začínáme

  • Nastavení Python, Spark a Hadoop
  • Pochopení datových struktur v Python
  • Pochopení PySpark API
  • Pochopení HDFS a MapReduce

Integrace Spark a Hadoop s Python

  • Implementace Spark RDD v Python
  • Zpracování dat pomocí MapReduce
  • Vytváření distribuovaných datových sad v HDFS

Machine Learning s Spark MLlib

Zpracování Big Data s Spark Streaming

Práce s Recommender Systems

Práce s Kafkou, Sqoopem, Kafkou a Flume

Apache Mahout se Sparkem a Hadoop

Odstraňování problémů

Shrnutí a další kroky

Požadavky

  • Zkušenosti se Sparkem a Hadoop
  • Python zkušenosti s programováním

Publikum

  • Datoví vědci
  • Vývojáři
 21 hodiny

Počet účastníků


Price per participant

Reference (3)

Upcoming Courses

Související kategorie