Apache Airflow for Data Science: Automating Machine Learning Pipelines Počítačový Kurz
Apache Airflow je platforma s otevřeným zdrojovým kódem pro orchestraci pracovních postupů a automatizaci složitých datových kanálů.
Toto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na středně pokročilé účastníky, kteří chtějí automatizovat a spravovat pracovní postupy strojového učení, včetně modelového školení, ověřování a nasazení pomocí Apache Airflow.
Na konci tohoto školení budou účastníci schopni:
- Nastavte Apache Airflow pro orchestraci pracovního postupu strojového učení.
- Automatizujte úlohy předběžného zpracování dat, trénování modelů a ověřování.
- Integrujte Airflow s rámcem a nástroji strojového učení.
- Nasaďte modely strojového učení pomocí automatizovaných kanálů.
- Monitorujte a optimalizujte pracovní postupy strojového učení ve výrobě.
Formát kurzu
- Interaktivní přednáška a diskuze.
- Spousta cvičení a cvičení.
- Praktická implementace v prostředí živé laboratoře.
Možnosti přizpůsobení kurzu
- Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.
Návrh Školení
Úvod do Apache Airflow pro Machine Learning
- Přehled Apache Airflow a jeho význam pro datovou vědu
- Klíčové funkce pro automatizaci pracovních postupů strojového učení
- Nastavení Airflow pro projekty datové vědy
Budova Machine Learning Potrubí s prouděním vzduchu
- Navrhování DAG pro end-to-end pracovní postupy ML
- Použití operátorů pro příjem dat, předběžné zpracování a inženýrství funkcí
- Plánování a správa závislostí potrubí
Školení a ověřování modelů
- Automatizace úloh modelového tréninku pomocí Airflow
- Integrace Airflow s ML frameworky (např. TensorFlow, PyTorch)
- Ověřování modelů a ukládání vyhodnocovacích metrik
Nasazení a monitorování modelu
- Nasazení modelů strojového učení pomocí automatizovaných kanálů
- Monitorování nasazených modelů s úkoly Airflow
- Zvládání rekvalifikací a aktualizací modelů
Pokročilé přizpůsobení a integrace
- Vývoj vlastních operátorů pro úkoly specifické pro ML
- Integrace Airflow s cloudovými platformami a službami ML
- Rozšíření pracovních postupů Airflow pomocí pluginů a senzorů
Optimalizace a škálování ML potrubí
- Zlepšení výkonu pracovního postupu pro rozsáhlá data
- Škálování nasazení Airflow s Celery a Kubernetes
- Osvědčené postupy pro pracovní postupy ML na produkční úrovni
Případové studie a praktické aplikace
- Reálné příklady automatizace ML pomocí Airflow
- Praktické cvičení: Vybudování end-to-end ML potrubí
- Diskuse o výzvách a řešeních v řízení workflow ML
Shrnutí a další kroky
Požadavky
- Znalost pracovních postupů a konceptů strojového učení
- Základní porozumění Apache Airflow, včetně DAG a operátorů
- Znalost Python programování
Publikum
- Datoví vědci
- Inženýři strojového učení
- Vývojáři AI
Open Training Courses require 5+ participants.
Apache Airflow for Data Science: Automating Machine Learning Pipelines Počítačový Kurz - Booking
Apache Airflow for Data Science: Automating Machine Learning Pipelines Počítačový Kurz - Enquiry
Upcoming Courses
Související kurzy
AdaBoost Python for Machine Learning
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a softwarové inženýry, kteří chtějí použít AdaBoost k vytvoření posilovacích algoritmů pro strojové učení s Python.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné vývojové prostředí, abyste mohli začít vytvářet modely strojového učení pomocí AdaBoost.
- Pochopte přístup k souborovému učení a jak implementovat adaptivní posilování.
- Přečtěte si, jak sestavit modely AdaBoost pro posílení algoritmů strojového učení v Python.
- Použijte ladění hyperparametrů ke zvýšení přesnosti a výkonu AdaBoost modelů.
Anaconda Ecosystem for Data Scientists
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce, kteří chtějí používat ekosystém Anaconda k zachycení, správě a nasazení balíčků a pracovních postupů analýzy dat na jediné platformě.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Anaconda komponenty a knihovny.
- Pochopte základní koncepty, funkce a výhody Anaconda.
- Spravujte balíčky, prostředí a kanály pomocí Navigátoru Anaconda.
- Používejte balíčky Conda, R a Python pro datovou vědu a strojové učení.
- Seznamte se s některými praktickými případy použití a technikami pro správu více datových prostředí.
AutoML with Auto-Keras
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce i na méně technické osoby, které chtějí používat Auto-Keras k automatizaci procesu výběru a optimalizace modelu strojového učení.
Na konci tohoto školení budou účastníci schopni:
- Automatizujte proces trénování vysoce účinných modelů strojového učení.
- Automaticky vyhledávejte nejlepší parametry pro modely hlubokého učení.
- Vytvářejte vysoce přesné modely strojového učení.
- Využijte sílu strojového učení k řešení skutečných obchodních problémů.
AutoML
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na technické osoby se zkušenostmi v oblasti strojového učení, které chtějí optimalizovat modely strojového učení používané pro detekci složitých vzorů ve velkých datech.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a vyhodnoťte různé open source AutoML nástroje (H2O AutoML, auto-sklearn, TPOT, TensorFlow, PyTorch, Auto-Keras, TPOT, Auto-WEKA atd.)
- Trénujte vysoce kvalitní modely strojového učení.
- Efektivně řešte různé typy problémů strojového učení pod dohledem.
- Napište pouze nezbytný kód pro zahájení procesu automatického strojového učení.
Creating Custom Chatbots with Google AutoML
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na účastníky s různou úrovní odbornosti, kteří chtějí využít platformu Google AutoML k vytvoření přizpůsobených chatbotů pro různé aplikace.
Na konci tohoto školení budou účastníci schopni:
- Pochopte základy vývoje chatbotů.
- Procházejte Google Cloud Platform a přejděte na AutoML.
- Připravte data pro trénování modelů chatbotů.
- Trénujte a vyhodnocujte vlastní modely chatbotů pomocí AutoML.
- Nasaďte a integrujte chatboty do různých platforem a kanálů.
- Sledujte a optimalizujte výkon chatbota v průběhu času.
DataRobot
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a datové analytiky, kteří chtějí automatizovat, vyhodnocovat a spravovat prediktivní modely pomocí schopností strojového učení DataRobot.
Na konci tohoto školení budou účastníci schopni:
- Načtěte datové sady v DataRobot pro analýzu, hodnocení a kontrolu kvality dat.
- Vytvářejte a trénujte modely pro identifikaci důležitých proměnných a splnění předpovědních cílů.
- Interpretujte modely a vytvořte cenné poznatky, které jsou užitečné při obchodních rozhodnutích.
- Monitorujte a spravujte modely pro udržení optimalizovaného výkonu predikce.
Data Mining with Weka
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na začátečníky až středně pokročilé datové analytiky a datové vědce, kteří chtějí používat Weka k provádění úloh dolování dat.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Weka.
- Pochopte Weka prostředí a pracovní plochu.
- Provádějte úlohy dolování dat pomocí Weka.
Google Cloud AutoML
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce, datové analytiky a vývojáře, kteří chtějí prozkoumat AutoML produkty a funkce k vytvoření a nasazení vlastních školicích modelů ML s minimálním úsilím.
Na konci tohoto školení budou účastníci schopni:
- Prozkoumejte produktovou řadu AutoML a implementujte různé služby pro různé typy dat.
- Připravte a označte datové sady pro vytvoření vlastních modelů ML.
- Trénujte a spravujte modely, abyste mohli vytvářet přesné a spravedlivé modely strojového učení.
- Vytvářejte předpovědi pomocí vyškolených modelů, abyste splnili obchodní cíle a potřeby.
Kaggle
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a vývojáře, kteří se chtějí učit a budovat svou kariéru v Data Science pomocí Kaggle.
Na konci tohoto školení budou účastníci schopni:
- Přečtěte si o datové vědě a strojovém učení.
- Prozkoumejte analýzu dat.
- Přečtěte si o Kaggle a jak to funguje.
Machine Learning for Mobile Apps using Google’s ML Kit
14 hodinyToto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí používat Google's ML Kit k vytváření modelů strojového učení, které jsou optimalizovány pro zpracování na mobilních zařízeních.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné vývojové prostředí, abyste mohli začít vyvíjet funkce strojového učení pro mobilní aplikace.
- Integrujte nové technologie strojového učení do Android a iOS aplikací pomocí ML Kit API.
- Vylepšete a optimalizujte stávající aplikace pomocí ML Kit SDK pro zpracování a nasazení na zařízení.
Accelerating Python Pandas Workflows with Modin
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a vývojáře, kteří chtějí používat Modin k sestavení a implementaci paralelních výpočtů s Pandas pro rychlejší analýzu dat.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné prostředí, abyste mohli začít vyvíjet pracovní postupy Pandas ve velkém měřítku s Modin.
- Pochopte funkce, architekturu a výhody Modin.
- Poznejte rozdíly mezi Modin, Dask a Rayem.
- Pomocí Modin provádějte operace Pandas rychleji.
- Implementujte celé Pandas API a funkce.
Machine Learning with Random Forest
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a softwarové inženýry, kteří chtějí používat Random Forest k vytváření algoritmů strojového učení pro velké datové sady.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné vývojové prostředí, abyste mohli začít vytvářet modely strojového učení s náhodnou doménovou strukturou.
- Pochopte výhody Random Forest a jak jej implementovat k vyřešení problémů klasifikace a regrese.
- Naučte se, jak zacházet s velkými datovými sadami a interpretovat více rozhodovacích stromů v Random Forest.
- Vyhodnoťte a optimalizujte výkon modelu strojového učení vyladěním hyperparametrů.
Advanced Analytics with RapidMiner
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na středně pokročilé datové analytiky, kteří se chtějí naučit používat RapidMiner k odhadování a projektování hodnot a využívat analytické nástroje pro prognózování časových řad.
Na konci tohoto školení budou účastníci schopni:
- Naučte se používat metodologii CRISP-DM, vyberte vhodné algoritmy strojového učení a vylepšete konstrukci a výkon modelu.
- Použijte RapidMiner k odhadu a projektování hodnot a použijte analytické nástroje pro prognózování časových řad.
RapidMiner for Machine Learning and Predictive Analytics
14 hodinyRapidMiner je open source softwarová platforma pro vědu o datech pro rychlé prototypování a vývoj aplikací. Zahrnuje integrované prostředí pro přípravu dat, strojové učení, hluboké učení, dolování textu a prediktivní analytiku.
V tomto živém školení vedeném instruktorem se účastníci naučí, jak používat RapidMiner Studio pro přípravu dat, strojové učení a nasazování prediktivních modelů.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte RapidMiner
- Připravte a vizualizujte data pomocí RapidMiner
- Ověřte modely strojového učení
- Mashup dat a vytváření prediktivních modelů
- Operacionalizujte prediktivní analytiku v rámci obchodního procesu
- Odstraňování problémů a optimalizace RapidMiner
Publikum
- Datoví vědci
- Inženýři
- Vývojáři
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení
Poznámka
- Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.
GPU Data Science with NVIDIA RAPIDS
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce a vývojáře, kteří chtějí použít RAPIDS k sestavení GPU-akcelerovaných datových kanálů, pracovních postupů a vizualizací s použitím algoritmů strojového učení, jako XGBoost, cuML atd.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné vývojové prostředí pro vytváření datových modelů pomocí NVIDIA RAPIDS.
- Pochopte vlastnosti, součásti a výhody RAPIDS.
- Využijte GPU k urychlení kompletních datových a analytických kanálů.
- Implementujte GPU-zrychlenou přípravu dat a ETL s cuDF a Apache Arrow.
- Naučte se provádět úlohy strojového učení pomocí algoritmů XGBoost a cuML.
- Vytvářejte vizualizace dat a provádějte analýzu grafů pomocí cuXfilter a cuGraph.