Zaawansowana analiza danych w Python – EY Academy of Business

Zaawansowana analiza danych w Python

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Uczestnicy rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn oraz zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh. Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego. Kursanci nauczą się przeprowadzać symulacje losowe oraz testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Szkolenie przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Dzięki udziałowi w szkoleniu uczestnicy:

  • Rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn.
  • Zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh.
  • Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego.
  • Nauczą się przeprowadzać symulacje losowe.
  • Nauczą się testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Oczekiwana wiedza wstępna:

Podstawowa znajomość języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib.

Zaawansowana wizualizacja danych

Bokeh

  • Interaktywna wizualizacja
  • Konfiguracja wyglądu
  • Wykres liniowy
  • Wykres rozrzutu
  • Suwaki i przyciski

Seaborn

  • Heatmap
  • Pair plot
  • Swarm plot
  • Box plot

Podstawy prawdopodobieństwa i statystyki

  • Prawdopodobieństwo
  • Korelacja danych
  • Rozkład ciągły i dyskretny
  • Gęstość prawdopodobieństwa
  • Funkcja masy prawdopodobieństwa
  • Rozkład standardowy
  • Centralne twierdzenie graniczne
  • Reguła 3 sigm

Wnioskowanie statystyczne

  • Liczby pseudolosowe
  • Symulacje losowe
  • p-value
  • Estymacja punktowa
  • Estymacja przedziałowa
  • Bootstrapowy przedział ufności
  • Metoda Monte Carlo
  • Testowanie hipotez
  • Test równości średnich
  • Test równości proporcji
  • Test normalności rozkładu

Stanisław Kaźmierczak - asystent i doktorant Politechniki Warszawskiej w obszarze uczenia maszynowego/data science. Prowadzi zajęcia i szkolenia z obszaru analizy danych, sieci neuronowych, głębokiego uczenia oraz szeroko rozumianej sztucznej inteligencji.

Zaawansowana analiza danych w Python

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Uczestnicy rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn oraz zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh. Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego. Kursanci nauczą się przeprowadzać symulacje losowe oraz testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Dla kogo?

Szkolenie przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Cele i korzyści

Dzięki udziałowi w szkoleniu uczestnicy:

  • Rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn.
  • Zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh.
  • Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego.
  • Nauczą się przeprowadzać symulacje losowe.
  • Nauczą się testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Oczekiwana wiedza wstępna:

Podstawowa znajomość języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib.

Program

Zaawansowana wizualizacja danych

Bokeh

  • Interaktywna wizualizacja
  • Konfiguracja wyglądu
  • Wykres liniowy
  • Wykres rozrzutu
  • Suwaki i przyciski

Seaborn

  • Heatmap
  • Pair plot
  • Swarm plot
  • Box plot

Podstawy prawdopodobieństwa i statystyki

  • Prawdopodobieństwo
  • Korelacja danych
  • Rozkład ciągły i dyskretny
  • Gęstość prawdopodobieństwa
  • Funkcja masy prawdopodobieństwa
  • Rozkład standardowy
  • Centralne twierdzenie graniczne
  • Reguła 3 sigm

Wnioskowanie statystyczne

  • Liczby pseudolosowe
  • Symulacje losowe
  • p-value
  • Estymacja punktowa
  • Estymacja przedziałowa
  • Bootstrapowy przedział ufności
  • Metoda Monte Carlo
  • Testowanie hipotez
  • Test równości średnich
  • Test równości proporcji
  • Test normalności rozkładu

Cena

2500 zł netto

Lokalizacja

Online

Termin

19-20 września 2022

Kontakt

Sabina Sikorska-Suwała

Ekspert ds. szkoleń z obszaru IT oraz Cybersecurity

  • +48 572 002 720
  • Sabina.Sikorska-Suwala@pl.ey.com