Návrh Školení
1. týden Big Data koncepty
- Definice VVVV (Velocity, Volume, Variety, Veracity) Limity tradiční kapacity zpracování dat Distribuované zpracování Statistická analýza Typy analýzy strojového učení Vizualizace dat Distribuované zpracování (např. map-reduce) Úvod do používaných jazyků Rychlý kurz jazyka R Python Rychlý kurz
2. a 3. týden vystoupení Data Analysis
- Statistická analýza Popisná Statistics v souborech velkých dat (např. výpočet střední hodnoty) Inferenční Statistics (odhad) Prognózování pomocí korelačních a regresních modelů Analýza časových řad Základy strojového učení Učení pod dohledem vs. učení bez dohledu Klasifikace a shlukování Odhad nákladů na konkrétní metody Filtr
4. týden Zpracování přirozeného jazyka
- Zpracování textu Pochopení významu textu Automatické generování textu Analýza sentimentu/tématu Computer Vision
5. a 6. týden Koncepce nástrojů
- Řešení úložiště dat (SQL, NeSQL, hierarchické, objektově orientované, orientované na dokumenty) MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, atd...) Výběr správného řešení problému Distribuované zpracování Spark Machine Learning se Spark (MLLib) Spark SQL Škálovatelnost Veřejný cloud (AWS, Google, atd...) Privátní cloud (OpenStack, cloudová slévárna) Autoškálovatelnost
7. týden Soft Skills
- Poradenství a Leadership Dovednosti Dopad: vyprávění příběhů na základě dat Porozumění publiku Efektivní prezentace dat – šíření vašeho sdělení Ovlivnění efektivity a změny vedení Zvládání obtížných situací
Zkouška
- Ukončení závěrečné zkoušky programu
Požadavky
Účastníci musí mít dobré základy v matematice, alespoň na úrovni střední školy.
Přestože nejsou vyžadovány znalosti programování, budou se hodit jakékoli znalosti programování.
Před účastí na tomto školicím programu budou účastníci posouzeni a pohovory.
Reference (4)
Understanding big data beter
Shaune Dennis - Vodacom
Kurz - Big Data Business Intelligence for Telecom and Communication Service Providers
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
Kurz - Introduction to Data Science and AI (using Python)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Kurz - Jupyter for Data Science Teams
The example and training material were sufficient and made it easy to understand what you are doing.