Návrh Školení

Úvod do Google Colab a Apache Spark

  • Přehled Google Colab
  • Úvod do Apache Spark
  • Nastavení Sparku v Google Colab

Zpracování dat pomocí Apache Spark

  • Práce s RDD a DataFrames
  • Načítání a zpracování velkých datových sad
  • Použití Spark SQL pro dotazování na strukturovaná data

Pokročilá analytika se Sparkem

  • Strojové učení se Spark MLlib
  • Provádění analýzy dat v reálném čase
  • Distribuované výpočty se Sparkem

Vizualizace a Collaboration v Google Colab

  • Integrace služby Colab s oblíbenými knihovnami vizualizací
  • Pracovní postupy spolupráce s notebooky Colab
  • Sdílení a export výsledků

Optimalizace Big Data Pracovní postupy

  • Ladění Sparku pro výkon
  • Optimalizace využití paměti a úložiště
  • Škálování pracovních postupů pro velké datové sady

Big Data v oblaku

  • Integrace Google Colab s cloudovými nástroji
  • Používání cloudového úložiště pro velká data
  • Práce se Sparkem v distribuovaných cloudových prostředích

Případové studie a osvědčené postupy

  • Recenze aplikací pro velká data v reálném světě
  • Případové studie využívající Apache Spark a Colab
  • Doporučené postupy pro analýzu velkých dat

Shrnutí a další kroky

Požadavky

  • Základní znalosti konceptů datové vědy
  • Znalost Apache Spark
  • Python znalosti programování

Publikum

  • Datoví vědci
  • Datoví inženýři
  • Výzkumníci pracující s velkými daty
 14 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie