Zapisy na kurs:
Zaawansowana statystyka i ekonometria w R
Opis kursu:
Kurs Zaawansowana statystyka i ekonometria w R to zajęcia z analizy danych na poziomie zaawansowanym, dla osób które mają dobrze opanowane podstawy statystyki matematycznej i posiadają praktykę w pracy z danymi. Grupą docelową są członkowie zespołów analitycznych i badawczych w firmach prywatnych instytucjach publicznych oraz na uniwersytetach, a także osoby aspirujące do takich zadań posiadające wstępne doświadczenie m. in. w przetwarzaniu danych, których interesuje modelowanie zjawisk i wnioskowanie statystyczne. Wcześniejsza znajomość podstaw programu R jest wymagana.
Kurs jest kompendium wiedzy i umiejętności o najpopularniejszych metodach modelowania statystycznego i ekonometrycznego – modelu ANOVA, regresji liniowej i logistycznej po podstawy analizy szeregów czasowych. Modele prezentowane są w praktycznych zastosowaniach – uczestnicy mają możliwość zmierzenia się z konkretnym problemem badawczym, następnie szacują pod kierunkiem prowadzącego właściwy model – oceniają jego przydatność i poprawność stosując odpowiednie testy statystyczne i miary dopasowania modeli do danych.
Szczegółowa tematyka kursu:
Zaawansowana statystyka cz. 1. ANOVA: budowa modelu, testowanie założeń, obciążenie Lovella, porównania wielokrotne i poprawka Tukeya, ANOVA jednoczynnikowa, dwuczynnikowa, model z interakcjami, testowanie istotności efektów (I, II i III rodzaju), rozszerzenia modelu ANOVA: ANOVA z powtarzalnymi pomiarami, model ANCOVA, model MANOVA, model nieparametryczny Kruskalla-Wallisa.
Zaawansowana statystyka cz. 2. Badania ewaluacyjne w R. Metodologia RCT (Randomized Control Trials), testy A/B w przedsiębiorstwie, kontrolowanie błędu II rodzaju, badanie mocy testu statystycznego. Metodologia bootstrap w badaniach statystycznych.
Ekonometria cz. 1. Regresja liniowa – powtórzenie i rozszerzenie. Budowa i diagnostyka modelu regresji liniowej, analiza reszt (normalność, autokorelacja, heteroskedastyczność), analiza obserwacji odstających (odległość Cooka, wykres dźwigni), badanie stabilności oszacowań (test Chowa), wybór najlepszej formy funkcyjnej (przekształcenie Boxa-Coxa, test ilorazu wiarygodności, regresja krokowa, algorytm leaps and bounds).
Ekonometria cz. 2. Uogólniony model liniowy na przykładzie regresji logistycznej. Estymacja modelu, liczenie efektów krańcowych i ilorazów szans. Interpretacja wyników, diagnostyka modelu.. Analiza wyników dopasowania: czułość, specyficzność, precyzja i dokładność. Estymacja i wizualizacja krzywej ROCAUC.
Ekonometria cz. 3. Wprowadzenie do analizy szeregów czasowych. Dekompozycja szeregów czasowych w formie addytywnej i multiplikatywnej. Stacjonarność szeregu czasowego – diagnostyka. Modele ADF, ARMA, ARIMA. Diagnostyka modeli (wykresy ACF, PACF, testy Boxa-Pierce’a, Ljunga-Boxa, test Jarque-Berra). Badanie sezonowości. Model SARIMA. Budowanie prognoz w modelach ARIMA i SARIMA.
- Nauczyciel: Piotr Ćwiakowski