Zaawansowana analiza danych w języku Python – EY Academy of Business

Zaawansowana analiza danych w języku Python

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.
Zapytaj o szkolenie
Dla kogo?

Szkolenie przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Cel szkolenia

Dzięki udziałowi w szkoleniu uczestnicy:

  • Rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn.
  • Zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh.
  • Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego.
  • Nauczą się przeprowadzać symulacje losowe.
  • Nauczą się testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Oczekiwana wiedza wstępna:

Podstawowa znajomość języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib.

Program szkolenia

Zaawansowana wizualizacja danych

Bokeh

  • Interaktywna wizualizacja
  • Konfiguracja wyglądu
  • Wykres liniowy
  • Wykres rozrzutu
  • Suwaki i przyciski

Seaborn

  • Heatmap
  • Pair plot
  • Swarm plot
  • Box plot

Podstawy prawdopodobieństwa i statystyki

  • Prawdopodobieństwo
  • Korelacja danych
  • Rozkład ciągły i dyskretny
  • Gęstość prawdopodobieństwa
  • Funkcja masy prawdopodobieństwa
  • Rozkład standardowy
  • Centralne twierdzenie graniczne
  • Reguła 3 sigm

Wnioskowanie statystyczne

  • Liczby pseudolosowe
  • Symulacje losowe
  • p-value
  • Estymacja punktowa
  • Estymacja przedziałowa
  • Bootstrapowy przedział ufności
  • Metoda Monte Carlo
  • Testowanie hipotez
  • Test równości średnich
  • Test równości proporcji
  • Test normalności rozkładu
Trenerzy
Stanisław Kaźmierczak
Asystent i doktorant Politechniki Warszawskiej w obszarze uczenia maszynowego/data science. Prowadzi zajęcia i szkolenia z obszaru analizy danych, sieci neuronowych, głębokiego uczenia oraz szeroko rozumianej sztucznej inteligencji.

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Uczestnicy rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn oraz zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh. Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego. Kursanci nauczą się przeprowadzać symulacje losowe oraz testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Sprawdź również:

Podstawy analizy danych w Pythonie

Wprowadzenie do uczenia maszynowego