Návrh Školení

Den první: Základy jazyka

  • Úvod do kurzu
  • O Data Science
    • Data Science Definice
    • Proces dělání Data Science.
  • Představujeme R Language
  • Proměnné a typy
  • Řídicí struktury (smyčky / podmíněné)
  • R Scalars, vektory a matice
    • Definování R vektorů
    • Matrice
  • Manipulace s řetězci a textem
    • Typ dat znaku
    • Soubor IO
  • Seznamy
  • Funkce
    • Představení funkcí
    • Uzávěry
    • funkce lapply/sapply
  • DataFrames
  • Laboratoře pro všechny sekce

Den druhý: Střední R Programming

  • DataFrames a soubor I/O
  • Čtení dat ze souborů
  • Příprava dat
  • Vestavěné datové sady
  • Vizualizace
    • Grafický balíček
    • plot() / barplot() / hist() / boxplot() / bodový graf
    • Tepelná mapa
    • balíček ggplot2 (qplot(), ggplot())
  • Průzkum s Dplyr
  • Laboratoře pro všechny sekce

Den třetí: Pokročilí Programming S R

  • Statistické modelování s R
    • Statistické funkce
    • Jednání s NA
    • Distribuce (binomické, Poissonovo, normální)
  • Regrese
    • Představujeme lineární regrese
  • Doporučení
  • Zpracování textu (tm package / Wordcloudy)
  • Shlukování
    • Úvod do Clusteringu
    • KMeans
  • Klasifikace
    • Úvod do klasifikace
    • Naivní Bayes
    • Rozhodovací stromy
    • Školení pomocí balíčku stříšky
    • Vyhodnocovací algoritmy
  • R a Big Data
    • Připojení R k databázím
    • Big Data Ekosystém
  • Laboratoře pro všechny sekce

Požadavky

  • Preferujeme základní programátorské znalosti

Nastavení

 21 hodiny

Počet účastníků


Price per participant

Reference (7)

Upcoming Courses

Související kategorie