Domů
Návrh Školení
Návrh Školení
Administrator Training for Apache Hadoop Training Course

Administrator Training for Apache Hadoop Training Course

Publikum:

Kurz je určen pro IT specialisty, kteří hledají řešení pro ukládání a zpracování velkých datových sad v prostředí distribuovaného systému

Goal:

Hluboké znalosti Hadoop administrace clusteru.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Návrh Školení

1: HDFS (17 %)

Popište funkci démonů HDFS
Popište běžný provoz clusteru Apache Hadoop, jak při ukládání dat, tak při zpracování dat.
Identifikujte současné vlastnosti výpočetních systémů, které motivují systém jako Apache Hadoop.
Klasifikujte hlavní cíle HDFS Design
Na základě scénáře identifikujte vhodný případ použití pro federaci HDFS
Identifikujte součásti a démona clusteru HDFS HA-Quorum
Analyzujte roli zabezpečení HDFS (Kerberos)
Určete nejlepší volbu serializace dat pro daný scénář
Popište cesty pro čtení a zápis souborů
Identifikujte příkazy pro manipulaci se soubory v prostředí souborového systému Hadoop

2: YARN a MapReduce verze 2 (MRv2) (17 %)

Pochopte, jak upgrade clusteru z Hadoop 1 na Hadoop 2 ovlivní nastavení clusteru
Pochopte, jak nasadit MapReduce v2 (MRv2 / YARN), včetně všech démonů YARN
Pochopte základní strategii návrhu pro MapReduce v2 (MRv2)
Určete, jak YARN zpracovává alokace zdrojů
Identifikujte pracovní postup úlohy MapReduce běžící na YARN
Určete, které soubory musíte změnit a jak chcete migrovat cluster z MapReduce verze 1 (MRv1) na MapReduce verze 2 (MRv2) běžící na YARN.

3: Hadoop Plánování klastrů (16 %)

Hlavní body, které je třeba vzít v úvahu při výběru hardwaru a operačních systémů pro hostování clusteru Apache Hadoop.
Analyzujte možnosti při výběru OS
Pochopte ladění jádra a výměnu disku
Na základě scénáře a vzoru zátěže určete konfiguraci hardwaru vhodnou pro daný scénář
Na základě scénáře určete, jaké komponenty ekosystému musí váš cluster provozovat, aby splnil smlouvu SLA
Velikost clusteru: na základě scénáře a frekvence provádění identifikujte specifika pro pracovní zátěž, včetně CPU, paměti, úložiště, diskových I/O
Velikost a konfigurace disku, včetně požadavků JBOD versus RAID, SAN, virtualizace a velikosti disku v clusteru
Síťové topologie: pochopte využití sítě v Hadoop (pro HDFS i MapReduce) a navrhněte nebo identifikujte klíčové komponenty návrhu sítě pro daný scénář

4: Hadoop Instalace a správa clusteru (25 %)

Na základě scénáře zjistěte, jak bude cluster zpracovávat selhání disku a počítače
Analyzujte konfiguraci protokolování a formát konfiguračního souboru protokolování
Pochopte základy Hadoop metrik a monitorování stavu clusteru
Identifikujte funkci a účel dostupných nástrojů pro monitorování clusteru
Být schopen nainstalovat všechny komponenty ekosystému v CDH 5, včetně (mimo jiné): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive a Pig
Identifikujte funkci a účel dostupných nástrojů pro správu souborového systému Apache Hadoop

5: Zdroj Management (10 %)

Pochopte celkové cíle návrhu každého z Hadoop plánovačů
Na základě scénáře určete, jak plánovač FIFO přiděluje prostředky clusteru
Na základě scénáře určete, jak Fair Scheduler přiděluje klastrové prostředky pod YARN
V daném scénáři určete, jak plánovač kapacity přiděluje prostředky clusteru

6: Monitorování a protokolování (15 %)

Pochopte funkce a vlastnosti schopností Hadoop shromažďovat metriky
Analyzujte webové uživatelské rozhraní NameNode a JobTracker
Pochopte, jak monitorovat clusterové démony
Identifikujte a monitorujte využití CPU na hlavních uzlech
Popište, jak monitorovat swap a alokaci paměti na všech uzlech
Zjistěte, jak zobrazit a spravovat soubory protokolu Hadoop
Interpretujte soubor protokolu

Požadavky

Základní Linux administrativní dovednosti
Základní znalosti programování

35 hodiny

Počet účastníků

Online

Classroom

Select Location

Please select a Venue

Price per participant

Open Training Courses require 5+ participants.

Administrator Training for Apache Hadoop Training Course - Booking

Jméno a příjmení *

Partnerství a certifikace *

Telefon *

Job Title

Company Name

Address 1 *

City *

State / Province

Kontaktujte NobleProg *

Postcode *

Start Date

Tax ID

Dates are subject to availability and take place between 09:30 and 16:30.

Payment *

Bank Transfer (Invoice, PO)

Debit / Credit Card

Comments

Allow Publishing Certificate

If you check this box the participants will receive an option to publish their course certificate on the NobleProg Certified Professional Catalogue.

Pravidla a podmínky *

I am an authorised representative of the above named client and I wish to book the above courses or services in accordance with NobleProg Terms and Conditions and Privacy Policy.

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop Training Course - Enquiry

Jméno a příjmení *

Partnerství a certifikace *

Telefon *

Počet účastníků

Company Name

Company Address

How do you want to take the course?

Client Premises

Online

Učebna

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop - Consultancy Enquiry

Consultancy Enquiry

Jméno a příjmení *

Telefon *

Partnerství a certifikace *

Company Name

Consultancy Subject *

Consultancy Goal

Consultancy Duration

Number of Consultants

Vhodné datum

Who will the consultant work with?

Consultancy Urgency *

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Reference (3)

I genuinely enjoyed the many hands-on sessions.

Jacek Pieczatka

Kurz - Administrator Training for Apache Hadoop

I genuinely enjoyed the big competences of Trainer.

Grzegorz Gorski

Kurz - Administrator Training for Apache Hadoop

I mostly liked the trainer giving real live Examples.

Simon Hahn

Kurz - Administrator Training for Apache Hadoop

Upcoming Courses

Administrator Training for Apache Hadoop

2025-09-29 09:30

35 hodiny

Praha, Pražský hrad

7500 EUR (Online)

8500 EUR (Učebna)

Administrator Training for Apache Hadoop

2025-10-13 09:30

35 hodiny

Brno

7500 EUR (Online)

7500 EUR (Učebna)

Administrator Training for Apache Hadoop

2025-10-27 09:30

35 hodiny

Ostrava

7500 EUR (Online)

7500 EUR (Učebna)

Související kurzy

Programming with Big Data in R

21 hodiny

Big Data je termín, který označuje řešení určená pro ukládání a zpracování velkých souborů dat. Tato řešení Big Data, původně vyvinutá Google, se vyvinula a inspirovala další podobné projekty, z nichž mnohé jsou dostupné jako open-source. R je oblíbený programovací jazyk ve finančním průmyslu.

R Fundamentals

21 hodiny

R je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R si také našel své následovníky mezi statistiky, inženýry a vědci bez znalostí počítačového programování, pro které je jeho použití snadné. Jeho popularita je způsobena stále větším využíváním data miningu pro různé cíle, jako je nastavení cen reklam, rychlejší nalezení nových léků nebo vyladění finančních modelů. R má širokou škálu balíčků pro dolování dat.

Data Mining with R

14 hodiny

Econometrics: Eviews and Risk Simulator

21 hodiny

Toto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na každého, kdo se chce naučit a zvládnout základy ekonometrické analýzy a modelování.

Na konci tohoto školení budou účastníci schopni:

Naučte se a pochopte základy ekonometrie.
Využijte Eviews a simulátory rizik.

Forecasting with R

14 hodiny

Toto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na středně pokročilé datové analytiky a obchodní profesionály, kteří chtějí provádět prognózy časových řad a automatizovat pracovní postupy analýzy dat pomocí R.

Na konci tohoto školení budou účastníci schopni:

Pochopte základy prognostických technik v R.
Aplikujte exponenciální vyhlazování a modely ARIMA pro analýzu časových řad.
Využijte balíček „forecast“ ke generování přesných předpovědních modelů.
Automatizujte předpovědní pracovní postupy pro obchodní a výzkumné aplikace.

HR Analytics for Public Organisations

14 hodiny

Toto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na personalisty, kteří chtějí pomocí analytických metod zlepšit výkonnost organizace. Tento kurz pokrývá kvalitativní i kvantitativní, empirické a statistické přístupy.

Formát kurzu

Interaktivní přednáška a diskuze.
Spousta cvičení a cvičení.

Možnosti přizpůsobení kurzu

Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.

Marketing Analytics using R

21 hodiny

Publikum

Business majitelé (marketingoví manažeři, produktoví manažeři, manažeři zákaznické základny) a jejich týmy; odborníci na zákaznické statistiky.

Přehled

Kurz sleduje životní cyklus zákazníka od získávání nových zákazníků, řízení stávajících zákazníků pro ziskovost, udržení dobrých zákazníků a nakonec pochopení toho, kteří zákazníci nás opouštějí a proč. Budeme pracovat se skutečnými (i když anonymními) daty z různých odvětví, včetně telekomunikací, pojišťovnictví, médií a špičkových technologií.

Formát

Školení vedené instruktorem v průběhu pěti půldenních lekcí s cvičením ve třídě a domácími úkoly. Může být poskytnut jako učební nebo distanční (online) kurz.

R for Data Analysis and Research

7 hodiny

Publikum

manažeři vývojáři vědci studenti

Formát kurzu

on-line výuka a diskuse NEBO osobní workshopy

Introduction to R

21 hodiny

R je open-source programovací jazyk pro statistické výpočetní techniky, analýzu dat a grafiku. Výzkum využívá rostoucí počet manažerů a analytiků v korporacích a akademii. R také našel následovníky mezi statistiky, inženýry a vědci bez počítačových programovacích dovedností, kteří ji snadno používají. Jeho popularita je vzhledem k rostoucímu používání datového těžby pro různé účely, jako je nastavení reklamních cen, nalezení nových léků rychleji nebo fin-tune finanční modely. R má širokou škálu balíčků pro data mining.

Tento kurz se zabývá manipulací s objekty v R včetně čtení dat, přístupu k R balíčkům, psaní funkcí R a tvorby informačních grafů. To zahrnuje analýzu dat pomocí běžných statistických modelů. Tento kurz učí, jak používat software R (https://www.r-project.org) jak na příkazové linii, tak v grafickém uživatelském rozhraní (GUI).

R

21 hodiny

Neural Network in R

14 hodiny

Tento kurz je úvodem do aplikace neuronových sítí v reálných problémech pomocí softwaru R-project.

Advanced R Programming

7 hodiny

Tento kurz je určen pro datové vědce a statistiky, kteří již mají základní dovednosti kódování R & C++ a R kód a potřebují pokročilé dovednosti kódování R.

Účelem je poskytnout praktický pokročilý kurz programování R účastníkům se zájmem o aplikaci metod v práci.

Aby bylo školení relevantní pro publikum, používají se příklady specifické pro daný sektor

Statistical Analysis using SPSS

21 hodiny

Toto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na začátečníky až středně pokročilé profesionály, kteří chtějí provádět statistickou analýzu pomocí SPSS za účelem přesné interpretace dat, provádění složitých statistických testů a vytváření smysluplných poznatků.

Na konci tohoto školení budou účastníci schopni:

Procházejte rozhraní SPSS a spravujte datové sady efektivně.
Provádějte deskriptivní a inferenční statistické analýzy.
Proveďte t-testy, ANOVA, MANOVA, regresní a korelační analýzy.
Použijte neparametrické testy, analýzu hlavních komponent a faktorovou analýzu pro pokročilou interpretaci dat.

Talent Acquisition Analytics

14 hodiny

Toto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na personalisty a náborové specialisty, kteří chtějí pomocí analytických metod zlepšit výkonnost organizace. Tento kurz pokrývá kvalitativní i kvantitativní, empirické a statistické přístupy.

Formát kurzu

Interaktivní přednáška a diskuze.
Spousta cvičení a cvičení.

Možnosti přizpůsobení kurzu

Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.

Introduction to Data Visualization with Tidyverse and R

7 hodiny

Cílová skupina

Formát kurzu

Po ukončení tohoto školení budou účastníci schopni:

Během tohoto vedeného instruktorem živého kurzu se účastníci naučí, jak manipulovat s daty a je visualizovat pomocí nástrojů obsažených v Tidyverse.

Tidyverse je sbírka flexibilních R balíčků pro čištění, zpracování, modelování a vizualizaci dat. Některé z obsažených balíčků jsou: ggplot2, dplyr, tidyr, readr, purrr a tibble.

Začátečníci v jazyce R
Začátečníci ve vyhledávání dat a vizualizaci dat

Část přednášky, část diskuse, cvičení a intenzivní praxe

Provádět analýzu dat a vytvářet působivé vizualizace
Těžit užitečné závěry z různých souborů vzorných dat
Filtrovat, řadit a shrnout data k odpovědi na zkoumavé otázky
Převádět zpracovaná data do informačních čarových grafů, sloupcových grafů a histogramů
Importovat a filtrovat data ze široké škály datových zdrojů, včetně Excel, CSV a SPSS souborů

Administrator Training for Apache Hadoop Training Course

Publikum:

Goal:

Návrh Školení

1: HDFS (17 %)

2: YARN a MapReduce verze 2 (MRv2) (17 %)

3: Hadoop Plánování klastrů (16 %)

4: Hadoop Instalace a správa clusteru (25 %)

5: Zdroj Management (10 %)

6: Monitorování a protokolování (15 %)

Požadavky

Reference (3)

Jacek Pieczatka

Kurz - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurz - Administrator Training for Apache Hadoop

Simon Hahn

Kurz - Administrator Training for Apache Hadoop

Upcoming Courses

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Související kategorie

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Administrator Training for Apache Hadoop Training Course

Publikum:

Goal:

Návrh Školení

1: HDFS (17 %)

2: YARN a MapReduce verze 2 (MRv2) (17 %)

3: Hadoop Plánování klastrů (16 %)

4: Hadoop Instalace a správa clusteru (25 %)

5: Zdroj Management (10 %)

6: Monitorování a protokolování (15 %)

Požadavky

Reference (3)

Jacek Pieczatka

Kurz - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurz - Administrator Training for Apache Hadoop

Simon Hahn

Kurz - Administrator Training for Apache Hadoop

Upcoming Courses

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Související kurzy

Programming with Big Data in R

R Fundamentals

Data Mining with R

Econometrics: Eviews and Risk Simulator

Forecasting with R

HR Analytics for Public Organisations

Marketing Analytics using R

Publikum

Přehled

Formát

R for Data Analysis and Research

Publikum

Formát kurzu

Introduction to R

R

Neural Network in R

Advanced R Programming

Statistical Analysis using SPSS

Talent Acquisition Analytics

Introduction to Data Visualization with Tidyverse and R

Související kategorie

Hadoop

Statistics

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites