Návrh Školení

I. Úvod a přípravná utkání

1. Přehled

  • Učinit R přátelštější, R a dostupná GUI
  • Rstudio
  • Související software a dokumentace
  • R a statistika
  • Interaktivní používání R
  • Úvodní sezení
  • Získání nápovědy s funkcemi a vlastnostmi
  • R příkazy, rozlišování malých a velkých písmen atd.
  • Vyvolání a oprava předchozích příkazů
  • Provádění příkazů ze souboru nebo přesměrování výstupu do souboru
  • Stálost dat a odstraňování objektů
  • Goodborná praxe programování: Samostatné skripty, dobrá čitelnost např. strukturované skripty, dokumentace, markdown
  • instalace balíčků; CRAN a Biovodič

2. Čtení dat

  • Soubory txt (read.delim)
  • CSV soubory

3. Jednoduché manipulace; čísla a vektory + pole

  • Vektory a zadání
  • Vektorová aritmetika
  • Generování pravidelných sekvencí
  • Logické vektory
  • Chybějící hodnoty
  • Znakové vektory
  • Indexové vektory; výběr a úprava podmnožin datové sady
    • Pole
  • Indexování pole. Podsekce pole
  • Indexové matice
  • Funkce pole() + jednoduché operace s poli např. násobení, transpozice
  • Jiné typy objektů

4. Seznamy a datové rámce

  • Seznamy
  • Vytváření a úpravy seznamů
    • Zřetězení seznamů
  • Datové rámce
    • Vytváření datových rámců
    • Práce s datovými rámci
    • Připojování libovolných seznamů
    • Správa vyhledávací cesty

5. Manipulace s daty

  • Výběr, podmnožiny pozorování a proměnných
  • Filtrování, seskupování
  • Překódování, transformace
  • Agregace, kombinování datových souborů
  • Vytváření rozdělených matic, cbind() a rbind()
  • Funkce zřetězení, (), s poli
  • Manipulace se znaky, balíček stringr
  • krátký úvod do grep a regexpr

6. Více o Čtení dat

  • Soubory XLS, XLSX
  • balíčky readr a readxl
  • SPSS, SAS, Stata,… a další formáty dat
  • Export dat do txt, csv a dalších formátů

6. Seskupování, smyčky a podmíněné provádění

  • Seskupené výrazy
  • Kontrolní výkazy
  • Podmíněné provedení: příkazy if
  • Opakované provádění: pro smyčky, opakování a při
  • intro do aplikovat, lapply, saapply, tapply

7. Funkce

  • Vytváření funkcí
  • Volitelné argumenty a výchozí hodnoty
  • Variabilní počet argumentů
  • Rozsah a jeho důsledky

8. Jednoduchá grafika v R

  • Vytvoření grafu
  • Grafy hustoty
  • Dot Plots
  • Barové pozemky
  • Spojnicové grafy
  • Koláčové grafy
  • Boxplots
  • Rozptylové pozemky
  • Kombinace pozemků

II. Statistická analýza v R

1. Rozdělení pravděpodobnosti

  • R jako soubor statistických tabulek
  • Zkoumání distribuce množiny dat

2. Testování hypotéz

  • Testy o populačním průměru
  • Test poměru pravděpodobnosti
  • Jedno- a dvouvýběrové testy
  • Chí-kvadrát GoTest neshody
  • Jednovzorová statistika Kolmogorov-Smirnov
  • Wilcoxon Signed-Rank Test
  • Test se dvěma vzorky
  • Wilcoxonův test hodnosti součtu
  • Mann-Whitney test
  • Kolmogorov-Smirnovův test

3. Vícenásobné testování hypotéz

  • Chyba typu I a FDR
  • ROC křivky a AUC
  • Více testovacích postupů (BH, Bonferroni atd.)

4. Lineární regresní modely

  • Obecné funkce pro extrakci informací o modelu
  • Aktualizace osazených modelů
  • Zobecněné lineární modely
    • Rodiny
    • Funkce glm().
  • Klasifikace
    • Logistická regrese
    • Lineární diskriminační analýza
  • Učení bez dozoru
    • Analýza hlavních komponent
    • Metody shlukování (k-průměry, hierarchické shlukování, k-medoidy)

5. Analýza přežití (balíček přežití)

  • Předměty přežití v r
  • Kaplan-Meierův odhad, log-rank test, parametrická regrese
  • Pásy sebevědomí
  • Cenzurovaná (intervalová cenzurovaná) analýza dat
  • Coxovy PH modely, konstantní kovariáty
  • Coxovy PH modely, časově závislé kovariáty
  • Simulace: Porovnání modelů (Porovnání regresních modelů)

6. Analýza rozptylu

  • Jednosměrná ANOVA
  • Dvoucestná klasifikace ANOVA
  • MANOVA

III. Zpracované problémy v bioinformatice

  • Krátký úvod k balíčku limma
  • Pracovní postup analýzy dat Microarray
  • Stažení dat z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Zpracování dat (QC, normalizace, diferenciální vyjádření)
  • Zápletka sopky
  • Custering příklady + heatmaps
 28 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie