Návrh Školení

Úvod do Large Language Models (LLMs)

  • Přehled LLM
  • Definice a význam
  • Aplikace v AI dnes

Architektura transformátoru

  • Co je to transformátor a jak funguje?
  • Hlavní komponenty a vlastnosti
  • Vkládání a poziční kódování
  • Vícehlavá pozornost
  • Dopředná neuronová síť
  • Normalizace a zbytková spojení

Modely transformátorů

  • Mechanismus sebepozornosti
  • Architektura kodér-dekodér
  • Polohové vložení
  • BERT (Obousměrné reprezentace kodéru od Transformers)
  • GPT (generativní předtrénovaný transformátor)

Optimalizace výkonu a úskalí

  • Délka kontextu
  • Mamba a stavové modely
  • Blesková pozornost
  • Řídké transformátory
  • Vizuální transformátory
  • Význam kvantování

Vylepšení transformátorů

  • Generování rozšířeného textu načítání
  • Směs modelů
  • Strom myšlenek

Doladění

  • Teorie nízkoúrovňové adaptace
  • Jemné doladění pomocí QLora

Zákony škálování a optimalizace v LLM

  • Význam škálovacích zákonů pro LLM
  • Měřítko velikosti dat a modelu
  • Výpočetní škálování
  • Škálování účinnosti parametrů

Optimalizace

  • Vztah mezi velikostí modelu, velikostí dat, výpočtovým rozpočtem a požadavky na odvození
  • Optimalizace výkonu a efektivity LLM
  • Osvědčené postupy a nástroje pro školení a dolaďování LLM

Školení a dolaďování LLM

  • Kroky a výzvy školení LLM od nuly
  • Sběr a údržba dat
  • Velké požadavky na data, CPU a paměť
  • Optimalizační výzvy
  • Krajina open-source LLM

Základy Reinforcement Learning (RL)

  • Úvod do Reinforcement Learning
  • Učení prostřednictvím pozitivního posilování
  • Definice a základní pojmy
  • Markovův rozhodovací proces (MDP)
  • Dynamické programování
  • Metody Monte Carlo
  • Temporal Difference Learning

hluboká Reinforcement Learning

  • Deep Q-Networks (DQN)
  • Proximální optimalizace zásad (PPO)
  • Elements z Reinforcement Learning

Integrace LLM a Reinforcement Learning

  • Kombinace LLM s Reinforcement Learning
  • Jak se RL používá v LLM
  • Reinforcement Learning s lidskou zpětnou vazbou (RLHF)
  • Alternativy k RLHF

Případové studie a aplikace

  • Aplikace v reálném světě
  • Úspěšné příběhy a výzvy

Pokročilá témata

  • Pokročilé techniky
  • Pokročilé optimalizační metody
  • Špičkový výzkum a vývoj

Shrnutí a další kroky

Požadavky

  • Základní porozumění Machine Learning

Publikum

  • Datoví vědci
  • Softwaroví inženýři
 21 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie