Návrh Školení

Big Data Přehled:

  • Co je Big Data
  • Proč Big Data získává na popularitě
  • Big Data Případové studie
  • Big Data Charakteristika
  • Řešení k práci Big Data.

Hadoop a jeho součásti:

  • Co je Hadoop a jaké jsou jeho součásti.
  • Hadoop Architektura a její charakteristiky dat, která dokáže zpracovat / Zpracovat.
  • Stručně o Hadoop Historie, společnosti, které jej používají a proč jej začaly používat.
  • Hadoop Rám a jeho součásti - podrobně vysvětleno.
  • Co je HDFS a čte - Zapisuje do Hadoop distribuovaného systému souborů.
  • Jak nastavit Hadoop Cluster v různých režimech – Stand-alone/Pseudo/Multi Node cluster.

(To zahrnuje nastavení Hadoop clusteru ve VirtualBox/KVM/VMware, síťové konfigurace, které je třeba pečlivě prozkoumat, spuštění Hadoop démonů a testování clusteru).

  • Co je to Map Reduce frame work a jak to funguje.
  • Spuštění mapy Snížit úlohy na Hadoop clusteru.
  • Pochopení replikace, zrcadlení a povědomí o racku v kontextu Hadoop klastrů.

Hadoop Plánování klastrů:

  • Jak naplánovat svůj hadoop cluster.
  • Pochopení hardwaru a softwaru pro plánování clusteru hadoop.
  • Porozumění pracovní zátěži a plánování clusteru, abyste se vyhnuli selhání a dosáhli optimálního výkonu.

Co je MapR a proč MapR:

  • Přehled MapR a jeho architektury.
  • Pochopení a fungování ovládacího systému MapR, svazků MapR, snímků a zrcadel.
  • Plánování clusteru v kontextu MapR.
  • Porovnání MapR s jinými distribucemi a Apache Hadoop.
  • Instalace MapR a nasazení clusteru.

Nastavení a správa klastru:

  • Správa služeb, uzlů, snímků, zrcadlových svazků a vzdálených clusterů.
  • Pochopení a správa uzlů.
  • Pochopení komponent Hadoop, Instalace komponent Hadoop vedle služeb MapR.
  • Accesssdílení dat na clusteru, včetně prostřednictvím NFS Správa služeb a uzlů.
  • Správa dat pomocí svazků, správa uživatelů a skupin, správa a přidělování rolí uzlům, uvádění do provozu vyřazování uzlů z provozu, správa clusteru a monitorování výkonu, konfigurace/analýza a monitorování metrik pro sledování výkonu, konfigurace a správa zabezpečení MapR.
  • Pochopení a práce s M7- Nativní úložiště pro tabulky MapR.
  • Konfigurace a ladění clusteru pro optimální výkon.

Upgrade klastru a integrace s dalšími nastaveními:

  • Aktualizace verze softwaru MapR a typy upgradu.
  • Konfigurace clusteru Mapr pro přístup ke clusteru HDFS.
  • Nastavení clusteru MapR na Amazon Elastic Mapreduce.

Všechna výše uvedená témata zahrnují ukázky a cvičné sezení pro studenty, aby si s touto technologií mohli sami vyzkoušet.

Požadavky

  • Základní znalost Linux FS
  • Základní Java
  • Znalost Apache Hadoop (doporučeno)
 28 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie