Návrh Školení

Úvod do Reinforcement Learning

  • Přehled posilovacího učení a jeho aplikací
  • Rozdíly mezi učením pod dohledem, bez dozoru a posilováním
  • Klíčové pojmy: agent, prostředí, odměny a politika

Markovovské rozhodovací procesy (MDP)

  • Pochopení stavů, akcí, odměn a stavových přechodů
  • Hodnotové funkce a Bellmanova rovnice
  • Dynamické programování pro řešení MDP

Základní RL algoritmy

  • Tabulkové metody: Q-Learning a SARSA
  • Metody založené na zásadách: Algoritmus REINFORCE
  • Actor-Critic frameworks a jejich aplikace

hluboká Reinforcement Learning

  • Úvod do Deep Q-Networks (DQN)
  • Zažijte opakované přehrávání a cílové sítě
  • Politické gradienty a pokročilé metody hlubokého RL

Rámce a nástroje RL

  • Úvod do OpenAI Tělocvična a další prostředí RL
  • Použití PyTorch nebo TensorFlow pro vývoj RL modelu
  • Školení, testování a srovnávání RL agentů

Výzvy v RL

  • Vyvažování zkoumání a využívání ve výcviku
  • Řešení problémů s řídkými odměnami a přidělováním kreditů
  • Scalaschopnosti a výpočetní problémy v RL

Hands-On Activities

  • Implementace Q-Learning a algoritmů SARSA od začátku
  • Školení agenta založeného na DQN, aby mohl hrát jednoduchou hru v OpenAI Gym
  • Jemné ladění modelů RL pro lepší výkon ve vlastních prostředích

Shrnutí a další kroky

Požadavky

  • Silné porozumění principům a algoritmům strojového učení
  • Znalost programování Python
  • Znalost neuronových sítí a rámců hlubokého učení

Publikum

  • Inženýři strojového učení
  • specialisté na AI
 14 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie