Návrh Školení
- Scala primer Rychlý úvod do Scala Labs: Seznámení se Scala Spark Základy Pozadí a historie Spark a Hadoop Spark koncepty a architektura Eko systém Spark (core, spark sql, mlib, streaming) Labs: Instalace a spuštění Spark První pohled na Spark Running Spark v místní režim Spark webové uživatelské rozhraní Spark shell Analýza datové sady – část 1 Laboratoře inspekce RDD: Průzkum RDD Koncepty RDD Oddíly Operace/transformace RDD Typy RDD Pár klíč-hodnota RDD MapReduce na RDD Ukládání a perzistence RDD Laboratoře: vytváření a kontrola RDD; Ukládání RDD Programování Spark API Úvod do Spark API / RDD API Odeslání prvního programu do Spark Ladění / protokolování Vlastnosti konfigurace Laboratoře : Programování ve Spark API, Odesílání úloh Podpora Spark SQL SQL v Spark Dataframes Definování tabulek a import datových sad Dotazování dat rámce pomocí SQL Formáty úložiště : JSON / Parquet Labs : Vytváření a dotazování datových rámců; vyhodnocování datových formátů MLlib Úvod MLlib Algoritmy MLlib Laboratoře : Psaní aplikací MLib Přehled knihovny GraphX GraphX Laboratoře rozhraní API GraphX : Zpracování dat grafů pomocí Spark Spark Streaming Přehled streamování Vyhodnocení Streamovacích platforem Operace streamování Operace posuvných oken Laboratoře Hadice ( Spark a Introop streamovací aplikace Sparkoop HDFS / YARN) Architektura Hadoop + Spark Spuštění Spark na Hadoop YARN Zpracování souborů HDFS pomocí Spark Spark Výkon a ladění proměnných vysílání Akumulátory Správa paměti a ukládání do mezipaměti Operace Spark Nasazení Sparku v produkci Ukázkové šablony nasazení Konfigurace Monitorování Odstraňování problémů
Požadavky
PŘEDPOŽADAVKY
znalost jazyka Java / Scala / Python (naše laboratoře v Scala a Pythonu) základní znalost vývojového prostředí Linux (navigace v příkazovém řádku / úprava souborů pomocí VI nebo nano)
Reference (6)
Doing similar exercises different ways really help understanding what each component (Hadoop/Spark, standalone/cluster) can do on its own and together. It gave me ideas on how I should test my application on my local machine when I develop vs when it is deployed on a cluster.
Thomas Carcaud - IT Frankfurt GmbH
Kurz - Spark for Developers
Ajay was very friendly, helpful and also knowledgable about the topic he was discussing.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Kurz - Spark for Developers
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Kurz - Spark for Developers
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Kurz - Spark for Developers
We know a lot more about the whole environment.
John Kidd
Kurz - Spark for Developers
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.