Data Engineering in Microsoft Fabric

GOC681
Duration 3 days
30 ITK points
0 terms
ČR (29 600 Kč)

SR (1 250 €)
Advanced

Školení je ideální pro datové profesionály, kteří chtějí posunout své dovednosti a plně ovládnout Data Engineering v prostředí Microsoft Fabric. Toto školení spolu se školením Data Analysis v Microsoft Fabric [GOC682] tvoří dohromady důkladnou přípravu na certifikační zkoušku DP-600: Fabric Analytics Engineer Associate. Naučíte se principy medaillon architektury, prozkoumáte metody získávání dat pomocí Dataflows Gen2, Pipelines a Notebooks. Kurz pokrývá ukládání dat, rozdíly mezi datovými sklady a Lakehouses, jejich dotazování a komponenty jako stored procedures, functions, data masking, atd. Automatizace procesů pomocí orchestračních pipelines vás naučí koordinovat data workflows a integrovat s medaillon architekturou. Z pohledu optimalizace výkonu se zaměříte na techniky jako partitioning a komprese. Naučíte se monitorovat kapacity a měřit efektivitu zpracování dat. Zkusíte si verzování a nasazování změn pomocí Git integrace a deployment pipelines.

Porozumíte principům a komponentům medallion architektury
Naučíte se, jak efektivně nastavit prostředí a konfigurovat nastavení tenantu
Prozkoumáte různé metody extrakce a načítání dat pomocí Dataflows Gen2, Pipelines a Notebooks
Zvládnete techniky kopírování a opětovného použití dat v OneLake
Ovládnete profilování, čištění a transformaci dat pomocí praktických příkladů
Ponoříte se do možností ukládání dat, včetně Data Warehouse a Data Lakes, a naučíte se, jak zabezpečit data
Objevíte, jak automatizovat Dataflows pomocí orchestračních pipelines
Naučíte se, jak monitorovat a optimalizovat výkon pomocí pokročilých technik
Pochopíte verzování a nasazování změn pomocí Git integrace a deployment pipelines

Kurz je zaměřen na datové inženýry a vývojáře, kteří se chtějí naučit efektivně pracovat v prostředí Microsoft Fabric. Dále je kurz vhodný pro business analytiky a datové architekty, kteří si chtějí zlepšit své dovednosti v oblasti správy a optimalizace dat.

Základní znalost relačních databází a jazyka SQL
Základní zkušenost s data warehouses nebo data lakes
Základní porozumění konceptům extrakce, načítání, profilování a transformace dat
Základní zkušenost s nástroji pro datovou analýzu a integraci dat (např. ETL procesy, data pipelines)
Znalost verzování a Git integrace výhodou

1. Nastavení prostředí a vysvětlení principů

Medaillon architecture - principy a komponenty:
- Data Lakes, Data Warehouses, strukturovaná analytika, sémantické modely, analytické engines
- nastavení tenantu, jak vybrat kapacitu, jak nad tím uvažovat

2. Data Ingestion a kopírování dat

Průzkum způsobů načtení dat
- Dataflows Gen2
- Pipelines
- Notebooks
Kopírování a přepoužití dat v rámci OneLake
- shortcuts
- rozhodovací metodika přístupu
- kdy jakou metodu zvolit, jak nad tím architektonicky přemýšlet + praktická aplikace, výroba

3. Data profiling, čištění a transformace

Data profiling
- principy
- implementace a možnosti v notebooks a dataflows gen2
Data cleaning and transforming
- sestavení čistících mechanismů na základě výsledků datové profilace
- implementace datových transformací
- slowly changing dimensions, atd.

4. Uložení dat

Rozdíly mezi Data Warehousem a Lakehousem a jejich vytvoření
Dotazování na data v rámci DWH a Lakehouse
- SQL dotazy a visual queries
- vnitroitemové dotazy, meziitemové dotazy
Komponenty v rámci DWH a Lakehouse
- store procedures, functions, roles, schemas, RLS, CLS, data masking, atd.
- kdy použít warehouse, lakehouse, jak pracovat s jejich daty, jak vytvářet jejich podružné komponenty, jak zabezpečit data

5. Automatizace

Orchestrační pipeline
- Koordinace – sekvencování data workflows
- Závislosti - správa pořadí exekucí
- Integrace - propojení s komponenty medallion architektury
Vnitřní orchestrace notebooků
- jak využít data pipelines pro orchestraci návazných pipelines, notebooků, dataflows, store procedures
- jak orchestrovat notebooky v rámci aktivní session
- implementace fail-over scénářů

6. Monitoring & optimalizace

Optimalizace výkonu
Bližší pohled na techniky vylepšující výkon
- Partitioning
- komprese
- V-order
- vacuuming
Admin perspektiva
- monitoring kapacit – sledování využití zdrojů
- metriky efektivity – měření efektivity zpracování dat

7. Verzování a nasazování změn

Git integrace
Deployment pipelines

Download PDF detail
Download PDF detail (no terms)

The prices are without VAT.

Custom Training

Didn’t find a suitable date or need training tailored to your team’s specific needs? We’ll be happy to prepare custom training for you.

Data Engineering in Microsoft Fabric

1. Nastavení prostředí a vysvětlení principů

2. Data Ingestion a kopírování dat

3. Data profiling, čištění a transformace

4. Uložení dat

5. Automatizace

6. Monitoring & optimalizace

7. Verzování a nasazování změn

GOPAS Praha

GOPAS Brno

GOPAS Bratislava

Business details

Data Engineering in Microsoft Fabric

1. Nastavení prostředí a vysvětlení principů

2. Data Ingestion a kopírování dat

3. Data profiling, čištění a transformace

4. Uložení dat

5. Automatizace

6. Monitoring & optimalizace

7. Verzování a nasazování změn

Previous courses

Related courses

GOPAS Praha

GOPAS Brno

GOPAS Bratislava

Business details