Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Úvod do Large Language Models (LLMs)
- Přehled LLM
- Definice a význam
- Aplikace v AI dnes
Architektura transformátoru
- Co je to transformátor a jak funguje?
- Hlavní komponenty a vlastnosti
- Vkládání a poziční kódování
- Vícehlavá pozornost
- Dopředná neuronová síť
- Normalizace a zbytková spojení
Modely transformátorů
- Mechanismus sebepozornosti
- Architektura kodér-dekodér
- Polohové vložení
- BERT (Obousměrné reprezentace kodéru od Transformers)
- GPT (generativní předtrénovaný transformátor)
Optimalizace výkonu a úskalí
- Délka kontextu
- Mamba a stavové modely
- Blesková pozornost
- Řídké transformátory
- Vizuální transformátory
- Význam kvantování
Vylepšení transformátorů
- Generování rozšířeného textu načítání
- Směs modelů
- Strom myšlenek
Doladění
- Teorie nízkoúrovňové adaptace
- Jemné doladění pomocí QLora
Zákony škálování a optimalizace v LLM
- Význam škálovacích zákonů pro LLM
- Měřítko velikosti dat a modelu
- Výpočetní škálování
- Škálování účinnosti parametrů
Optimalizace
- Vztah mezi velikostí modelu, velikostí dat, výpočtovým rozpočtem a požadavky na odvození
- Optimalizace výkonu a efektivity LLM
- Osvědčené postupy a nástroje pro školení a dolaďování LLM
Školení a dolaďování LLM
- Kroky a výzvy školení LLM od nuly
- Sběr a údržba dat
- Velké požadavky na data, CPU a paměť
- Optimalizační výzvy
- Krajina open-source LLM
Základy Reinforcement Learning (RL)
- Úvod do Reinforcement Learning
- Učení prostřednictvím pozitivního posilování
- Definice a základní pojmy
- Markovův rozhodovací proces (MDP)
- Dynamické programování
- Metody Monte Carlo
- Temporal Difference Learning
hluboká Reinforcement Learning
- Deep Q-Networks (DQN)
- Proximální optimalizace zásad (PPO)
- Elements z Reinforcement Learning
Integrace LLM a Reinforcement Learning
- Kombinace LLM s Reinforcement Learning
- Jak se RL používá v LLM
- Reinforcement Learning s lidskou zpětnou vazbou (RLHF)
- Alternativy k RLHF
Případové studie a aplikace
- Aplikace v reálném světě
- Úspěšné příběhy a výzvy
Pokročilá témata
- Pokročilé techniky
- Pokročilé optimalizační metody
- Špičkový výzkum a vývoj
Shrnutí a další kroky
Požadavky
- Základní porozumění Machine Learning
Publikum
- Datoví vědci
- Softwaroví inženýři
21 hodiny