Návrh Školení

Úvod do DeepSeek LLM Fine-Tuning

  • Přehled modelů DeepSeek, např. DeepSeek-R1 a DeepSeek-V3
  • Pochopení potřeby vyladění LLM
  • Porovnání jemného ladění vs. promptní inženýrství

Příprava datové sady pro Fine-Tuning

  • Správa datových sad specifických pro doménu
  • Techniky předzpracování a čištění dat
  • Tokenizace a formátování datové sady pro DeepSeek LLM

Nastavení prostředí Fine-Tuning

  • Konfigurace GPU a akcelerace TPU
  • Nastavení Hugging Face transformátorů s DeepSeek LLM
  • Pochopení hyperparametrů pro jemné doladění

Fine-Tuning DeepSeek LLM

  • Provádění supervizovaného doladění
  • Použití LoRA (adaptace na nízké hodnocení) a PEFT (parametrově efektivní Fine-Tuning)
  • Spuštění distribuovaného jemného ladění pro rozsáhlé datové sady

Vyhodnocování a optimalizace vyladěných modelů

  • Posouzení výkonnosti modelu pomocí hodnotících metrik
  • Zvládání přemontování a podsazení
  • Optimalizace rychlosti odvození a efektivity modelu

Nasazení jemně vyladěných DeepSeek modelů

  • Modely balení pro nasazení API
  • Integrace vyladěných modelů do aplikací
  • Škálování nasazení pomocí cloudu a edge computingu

Real-World Use Cases a aplikace

  • Vyladěné LLM pro finance, zdravotnictví a zákaznickou podporu
  • Případové studie průmyslových aplikací
  • Etické úvahy v doménově specifických modelech umělé inteligence

Shrnutí a další kroky

Požadavky

  • Zkušenosti s rámcem strojového učení a hlubokého učení
  • Znalost transformátorů a velkých jazykových modelů (LLM)
  • Porozumění technikám předzpracování dat a modelování

Publikum

  • Výzkumníci AI zkoumají dolaďování LLM
  • Inženýři strojového učení vyvíjející vlastní modely umělé inteligence
  • Pokročilí vývojáři implementující řešení řízená umělou inteligencí
 21 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie