Návrh Školení

Zavedení

  • Apache Beam vs MapReduce, Spark Streaming, Kafka Streaming, Storm a Flink

Instalace a konfigurace Apache Beam

Přehled Apache Beam Funkce a architektura

  • Model paprsku, sady SDK, vedení paprsků
  • Distribuované back-endy zpracování

Pochopení modelu Apache Beam Programming

  • Jak se provádí potrubí

Spuštění vzorkového potrubí

  • Příprava WordPočítacího potrubí
  • Lokální provedení potrubí

Projektování potrubí

  • Plánování struktury, výběr transformací a stanovení vstupních a výstupních metod

Vytvoření potrubí

  • Psaní programu ovladače a definování potrubí
  • Použití tříd Apache Beam
  • Datové sady, transformace, I/O, kódování dat atd.

Provádění potrubí

  • Spuštění kanálu lokálně, na vzdálených počítačích a ve veřejném cloudu
  • Výběr běžce
  • Konfigurace specifické pro běžce

Testování a ladění Apache Beam

  • Použití tipů pro emulaci statického psaní
  • Správa Python Závislostí potrubí

Zpracování vázaných a neohraničených datových sad

  • Okna a spouštěče

Vaše potrubí bude znovu použitelné a udržovatelné

Vytvořte nové zdroje dat a jímky

  • Apache Beam Source and Sink API

Integrace Apache Beam s jinými Big Data systémy

  • Apache Hadoop, Apache Spark, Apache Kafka

Odstraňování problémů

Shrnutí a závěr

Požadavky

  • Zkušenosti s Python Programming.
  • Zkušenosti s příkazovým řádkem Linux.

Publikum

  • Vývojáři
 14 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie