Návrh Školení

spark.mllib: datové typy, algoritmy a nástroje

  • Datové typy
  • Základní statistiky
    • souhrnné statistiky
    • korelace
    • stratifikovaný výběr
    • testování hypotéz
    • testování významnosti streamování
    • náhodné generování dat
  • Klasifikace a regrese
    • lineární modely (SVM, logistická regrese, lineární regrese)
    • naivní Bayes
    • rozhodovací stromy
    • soubory stromů (Random Forests a Gradient-Boosted Trees)
    • izotonická regrese
  • Kolaborativní filtrování
    • střídání nejmenších čtverců (ALS)
  • Shlukování
    • k-prostředky
    • Gaussova směs
    • clustering power iteration (PIC)
    • latentní Dirichletova alokace (LDA)
    • půlící k-průměr
    • streaming k-means
  • Redukce rozměrů
    • dekompozice singulární hodnoty (SVD)
    • analýza hlavních komponent (PCA)
  • Extrakce a transformace rysů
  • Časté dolování vzorů
    • FP-růst
    • asociační pravidla
    • PrefixSpan
  • Metriky hodnocení
  • Export modelu PMML
  • Optimalizace (vývojář)
    • stochastický gradientní sestup
    • BFGS s omezenou pamětí (L-BFGS)

spark.ml: API na vysoké úrovni pro ML potrubí

  • Přehled: estimátory, transformátory a potrubí
  • Extrahování, transformace a výběr prvků
  • Klasifikace a regrese
  • Shlukování
  • Pokročilá témata

Požadavky

Znalost jednoho z následujících:

  • Jáva
  • Scala
  • Krajta
  • SparkR.
 35 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie