Wprowadzenie do integracji danych i koncepcji ETL

Cel szkolenia:

Celem szkolenia jest wprowadzenie uczestników do zagadnień integracji danych oraz wykorzystania systemów klasy ETL (Extract-Transform-Load). W ramach intensywnego, jednodniowego szkolenia uczestnicy zapoznają się z koncepcją budowy i wykorzystania hurtowni danych, jako głównego odbiorcy koncepcji integracji danych oraz nabędą wiedzę niezbędną do pełnego zrozumienia idei systemów ETL. Szkolenie jest niezależne od konkretnych platform technologicznych i jest polecane wszystkim osobom, które biorą udział w projektach związanych z przetwarzaniem dużej ilości danych oraz integracji danych.

Ramowy zakres szkolenia:

  • Przypomnienie wiedzy z zakresu baz danych
  • Wprowadzenie do tematyki hurtowni danych
    • Źródła danych
    • Systemy transakcyjne vs hurtownie danych
    • Warstwy hurtowni danych
  • Wstęp do integracji danych
    • Wyzwania integracji danych
    • Koncepcja ETL
    • Wymagania stawiane narzędziom ETL
  • Wprowadzenie do koncepcji Ralpha Kimballa dotyczącej 34 podsystemów w procesie Data Integration
  • Ekstrakcja danych
    • Rozpoznawanie źródeł
    • Profilowanie danych
    • Change Data Capture
  • Czyszczenie i uzgadnianie danych
    • Poprawa znanych błędów
    • Mechanizmy czyszczenia oparte na dopasowaniu niejednoznacznym
    • Uzgodnienie danych
  • Modelowanie miar i wymiarów
    • Zarządzanie kluczami
    • Zastosowanie lookup w modelowaniu
    • Denormalizacja
    • Slowly Changing Dimension

Wymagana wiedza wejściowa:

Uczestnicy powinni posiadać podstawową wiedzę dot. baz danych. Zalecana jest znajomość języka SQL lub dowolnego narzędzia klasy ETL.

Sposób realizacji:

Szkolenie z zastosowaniem kartki i ołówka. Połączenie części wykładowej (około 80%) z ćwiczeniową (około 20%).

Czas trwania:

8 godzin lekcyjnych (po 45 minut)

Liczebność grupy szkoleniowej:

do 8 osób

FIRMA
DORADZTWO
ROZWIĄZANIA IT
ANALITYKA DANYCH
SZKOLENIA
KONTAKT