Návrh Školení

Pokročilé Reinforcement Learning Techniky

Nasazování Reinforcement Learning Modelů

Průzkum a Exploitace

Úvod do Reinforcement Learning

Zásady založené na politice

Q-learning a hluboké Q-sítě (DQNs)

Shrnutí a Další Kroky

Práce s OpenAI Gym

  • Zachování rovnováhy mezi průzkumem a exploitací v RL modelech
  • Strategie pro průzkum: epsilon-hladké, softmax a další
  • Úvod do Q-learningu
  • Implementace DQNů pomocí TensorFlow
  • Optimalizace Q-learningu s použitím zpětného prožitku a cílových sítí
  • Multiagentní reforční učení
  • Profundní deterministický gradient politiky (DDPG)
  • Proximalna optimalizace politiky (PPO)
  • Algoritmy gradientu politik
  • Algoritmus REINFORCE a jeho implementace
  • Metody herec-kritika
  • Reálné aplikace reforčního učení
  • Integrace RL modelů do produkčních prostředí
  • Nastavení prostředí v OpenAI Gym
  • Simulace agentů v dynamických prostředích
  • Hodnocení výkonu agenta
  • Co je reforční učení?
  • Klíčové koncepty: agent, prostředí, stavy, akce a odměny
  • Výzvy při reforčním učení

Požadavky

Audience

  • Datoví vědci
  • Praktikové strojového učení
  • Výzkumní pracovníci v oblasti umělé inteligence
  • Zkušenosti s programováním Python
  • Základní znalost konceptů hlubokého učení a strojového učení
  • znalost algoritmů a matematických konceptů používaných v reforcovaném učení
 28 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie