Zaawansowana analiza danych w języku Python – EY Academy of Business

Zaawansowana analiza danych w języku Python

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.
Zapisz się
Dla kogo?

Szkolenie przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Cel szkolenia

Dzięki udziałowi w szkoleniu uczestnicy:

  • Rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn.
  • Zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh.
  • Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego.
  • Nauczą się przeprowadzać symulacje losowe.
  • Nauczą się testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Oczekiwana wiedza wstępna:

Podstawowa znajomość języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib.

Program szkolenia

Zaawansowana wizualizacja danych

Bokeh

  • Interaktywna wizualizacja
  • Konfiguracja wyglądu
  • Wykres liniowy
  • Wykres rozrzutu
  • Suwaki i przyciski

Seaborn

  • Heatmap
  • Pair plot
  • Swarm plot
  • Box plot

Podstawy prawdopodobieństwa i statystyki

  • Prawdopodobieństwo
  • Korelacja danych
  • Rozkład ciągły i dyskretny
  • Gęstość prawdopodobieństwa
  • Funkcja masy prawdopodobieństwa
  • Rozkład standardowy
  • Centralne twierdzenie graniczne
  • Reguła 3 sigm

Wnioskowanie statystyczne

  • Liczby pseudolosowe
  • Symulacje losowe
  • p-value
  • Estymacja punktowa
  • Estymacja przedziałowa
  • Bootstrapowy przedział ufności
  • Metoda Monte Carlo
  • Testowanie hipotez
  • Test równości średnich
  • Test równości proporcji
  • Test normalności rozkładu
Trenerzy
Stanisław Kaźmierczak
Asystent i doktorant Politechniki Warszawskiej w obszarze uczenia maszynowego/data science. Prowadzi zajęcia i szkolenia z obszaru analizy danych, sieci neuronowych, głębokiego uczenia oraz szeroko rozumianej sztucznej inteligencji.

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Uczestnicy rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn oraz zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh. Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego. Kursanci nauczą się przeprowadzać symulacje losowe oraz testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Sprawdź również:

Podstawy analizy danych w Pythonie

Wprowadzenie do uczenia maszynowego