Zapisy na kurs:

Zaawansowana statystyka matematyczna w R


Opis kursu:

Kurs na poziomie zaawansowanym, dla osób które mają dobrze opanowane podstawy statystyki matematycznej i posiadają praktykę w pracy z danymi. Grupą docelową są członkowie zespołów analitycznych i badawczych w podmiotach prywatnych i publicznych. Kurs jest kompendium wiedzy i umiejętności o zaawansowanych metodach statystycznych – od modelu ANOVA i testu Kruskala Wallisa po modele statystyki wielowymiarowej – analizę czynnikową i PCA i wprowadzenie do Data Miningu. Aplikacja modeli prezentowane są w praktycznych przykładach – uczestnicy mają możliwość zmierzenia się z konkretnym problemem badawczym, następnie szacują pod kierunkiem prowadzącego właściwy model – oceniają jego przydatność i poprawność stosując odpowiednie testy statystyczne.


Szczegółowa tematyka kursu:

  • Statystyka matematyczna: procedura weryfikacji hipotez statystycznych, poziom istotności, przedział ufności, badanie mocy testu
  • Model jedno czynnikowy ANOVA – budowa modelu, testowanie założeń, obciążenia Lovella, porównania wielokrotne i poprawka Tukeya
  • Model dwuczynnikowy ANOVA: model z interakcją, testowanie istotności efektów (I, II i III rodzaju, modele z obserwacjami zależnymi)
  • Rozszerzenia modelu ANOVA: model ANCOVA, model MANOVA, model nieparametryczny Kruskalla-Wallisa
  • Analiza współzależności: tradycyjne współczynniki korelacji, korelacja nieliniowa, zaawansowane testy korelacji, korelogramy jako metody wizualizacji wyników, tablica kontyngencji: przegląd testów niezależności, przegląd testów siły związku, analiza ilorazów szans i relatywnego ryzyka, czułość, specyficzność i dokładność
  • Analiza korespondencji: metodologia, diagnostyka, metody wizualizacji
  • Zaawansowana analiza regresji liniowej: budowa i diagnostyka modelu, analiza reszt (normalność, autokorelacja, heteroskedastyczność), analiza obserwacji odstających (odległość Cooka, wykres dźwigni), badanie stabilności oszacowań (test Chowa) wybór najlepszej formy funkcyjnej (przekształcenie Boxa-Coxa, test ilorazu wiarygodności)
  • Modele mieszane: Metoda największej wiarygodności: efekty stałe i losowe, modele mieszane z 1 i 2 komponentami wariacyjnymi, modele hierarchiczne
  • Wstęp do Data Miningu: analiza głównych składowych (PCA), drzewa klasyfikacyjne – estymacja, interpretacja diagnostyka