Návrh Školení
- Machine Learning úvod
- Typy strojového učení – učení pod dohledem vs. učení bez dozoru
- Od statistického učení ke strojovému učení
- Pracovní postup Data Mining:
- Business pochopení
- Porozumění datům
- Příprava dat
- Modelování
- Hodnocení
- Rozvinutí
- Algoritmy strojového učení
- Výběr vhodného algoritmu pro daný problém
- Overfitting a kompromis odchylky-variance v ML
- ML knihovny a programovací jazyky
- Proč používat programovací jazyk
- Výběr mezi R a Python
- Python rychlokurz
- Python zdroje
- Python Knihovny pro strojové učení
- Jupyter notebooky a interaktivní kódování
- Testování ML algoritmů
- Generalizace a overfitting
- Vyvarujte se přemontování
- Metoda výdrže
- Křížová validace
- Bootstrapping
- Vyhodnocování numerických předpovědí
- Míry přesnosti: ME, MSE, RMSE, MAPE
- Stabilita parametrů a predikce
- Vyhodnocování klasifikačních algoritmů
- Přesnost a její problémy
- Matice zmatku
- Problém nevyvážených tříd
- Vizualizace výkonu modelu
- Zisková křivka
- ROC křivka
- Křivka zdvihu
- Výběr modelu
- Ladění modelu – grid search strategie
- Příklady v Python
- Příprava dat
- Import a ukládání dat
- Pochopte data – základní průzkumy
- Manipulace s daty s knihovnou pandas
- Transformace dat – Data wrangling
- Průzkumná analýza
- Chybějící pozorování – detekce a řešení
- Odlehlé hodnoty – detekce a strategie
- Standardizace, normalizace, binarizace
- Kvalitativní překódování dat
- Příklady v Python
- Klasifikace
- Binární vs vícetřídní klasifikace
- Klasifikace pomocí matematických funkcí
- Lineární diskriminační funkce
- Kvadratické diskriminační funkce
- Logistická regrese a pravděpodobnostní přístup
- k-nejbližší sousedé
- Naivní Bayes
- Rozhodovací stromy
- VOZÍK
- Pytlování
- Random Forest s
- Posílení
- Xgboost
- Podporujte vektorové stroje a jádra
- Klasifikátor maximální marže
- Podpora Vector Machine
- Souborové učení
- Příklady v Python
- Regrese a numerická predikce
- Odhad nejmenších čtverců
- Techniky výběru proměnných
- Regularizace a stabilita- L1, L2
- Nelinearity a zobecněné nejmenší čtverce
- Polynomiální regrese
- Regresní splajny
- Regresní stromy
- Příklady v Python
- Učení bez dozoru
- Shlukování
- Shlukování založené na centroidech – k-means, k-medoids, PAM, CLARA
- Hierarchické shlukování – Diana, Agnes
- Klastrování založené na modelu - EM
- Samoorganizující se mapy
- Hodnocení a hodnocení shluků
- Redukce rozměrů
- Analýza hlavních komponent a faktorová analýza
- Dekompozice singulární hodnoty
- Vícerozměrné škálování
- Příklady v Python
- Shlukování
- Těžba textu
- Předzpracování dat
- Model pytle se slovy
- Stemming a lemmizace
- Analýza četnosti slov
- Analýza sentimentu
- Vytváření slovních mraků
- Příklady v Python
- Motory doporučení a kolaborativní filtrování
- Údaje o doporučení
- Kolaborativní filtrování na základě uživatele
- Kolaborativní filtrování na základě položek
- Příklady v Python
- Těžba asociačních vzorů
- Algoritmus častých položek
- Analýza tržního koše
- Příklady v Python
- Analýza odlehlých hodnot
- Analýza extrémních hodnot
- Detekce odlehlých hodnot na základě vzdálenosti
- Metody založené na hustotě
- Detekce vysokorozměrných odlehlých hodnot
- Příklady v Python
- Machine Learning případová studie
- Business pochopení problému
- Předzpracování dat
- Výběr a ladění algoritmu
- Vyhodnocení nálezů
- Rozvinutí
Požadavky
Znalost a povědomí Machine Learning základů
Reference (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Kurz - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurz - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback