Návrh Školení
Úvod do Google Colab a Apache Spark
- Přehled Google Colab
- Úvod do Apache Spark
- Nastavení Sparku v Google Colab
Zpracování dat pomocí Apache Spark
- Práce s RDD a DataFrames
- Načítání a zpracování velkých datových sad
- Použití Spark SQL pro dotazování na strukturovaná data
Pokročilá analytika se Sparkem
- Strojové učení se Spark MLlib
- Provádění analýzy dat v reálném čase
- Distribuované výpočty se Sparkem
Vizualizace a Collaboration v Google Colab
- Integrace služby Colab s oblíbenými knihovnami vizualizací
- Pracovní postupy spolupráce s notebooky Colab
- Sdílení a export výsledků
Optimalizace Big Data Pracovní postupy
- Ladění Sparku pro výkon
- Optimalizace využití paměti a úložiště
- Škálování pracovních postupů pro velké datové sady
Big Data v oblaku
- Integrace Google Colab s cloudovými nástroji
- Používání cloudového úložiště pro velká data
- Práce se Sparkem v distribuovaných cloudových prostředích
Případové studie a osvědčené postupy
- Recenze aplikací pro velká data v reálném světě
- Případové studie využívající Apache Spark a Colab
- Doporučené postupy pro analýzu velkých dat
Shrnutí a další kroky
Požadavky
- Základní znalosti konceptů datové vědy
- Znalost Apache Spark
- Python znalosti programování
Publikum
- Datoví vědci
- Datoví inženýři
- Výzkumníci pracující s velkými daty
Reference (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Kurz - ArcGIS Fundamentals
Laboratorní cvičení
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Kurz - Automated Monitoring with Zabbix
Machine Translated
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Kurz - QGIS for Geographic Information System
Líbil se mi Pablův styl, skutečnost, že pokryl spoustu témat od návrhu sestav, přizpůsobení pomocí html až po implementaci jednoduchých algoritmů ML. Good rovnováhy teoretické informace / cvičení. Pablo skutečně pokryl všechna témata, která mě zajímala, a poskytl vyčerpávající odpovědi na mé otázky.
Cristian Tudose - SC Automobile Dacia SA
Kurz - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Actual application of spotfire and all basic functions.