Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
spark.mllib: datové typy, algoritmy a nástroje
- Datové typy
- Základní statistiky
- souhrnné statistiky
- korelace
- stratifikovaný výběr
- testování hypotéz
- testování významnosti streamování
- náhodné generování dat
- Klasifikace a regrese
- lineární modely (SVM, logistická regrese, lineární regrese)
- naivní Bayes
- rozhodovací stromy
- soubory stromů (Random Forests a Gradient-Boosted Trees)
- izotonická regrese
- Kolaborativní filtrování
- střídání nejmenších čtverců (ALS)
- Shlukování
- k-prostředky
- Gaussova směs
- clustering power iteration (PIC)
- latentní Dirichletova alokace (LDA)
- půlící k-průměr
- streaming k-means
- Redukce rozměrů
- dekompozice singulární hodnoty (SVD)
- analýza hlavních komponent (PCA)
- Extrakce a transformace rysů
- Časté dolování vzorů
- FP-růst
- asociační pravidla
- PrefixSpan
- Metriky hodnocení
- Export modelu PMML
- Optimalizace (vývojář)
- stochastický gradientní sestup
- BFGS s omezenou pamětí (L-BFGS)
spark.ml: API na vysoké úrovni pro ML potrubí
- Přehled: estimátory, transformátory a potrubí
- Extrahování, transformace a výběr prvků
- Klasifikace a regrese
- Shlukování
- Pokročilá témata
Požadavky
Znalost jednoho z následujících:
- Jáva
- Scala
- Krajta
- SparkR.
35 hodiny
Reference (1)
Spousta praktických příkladů, různé způsoby, jak přistupovat ke stejnému problému, a někdy ne tak samozřejmé triky, jak stávající řešení vylepšit
Rafal - Nordea
Kurz - Apache Spark MLlib
Machine Translated