Zapisy na kurs:
Analiza i wizualizacja danych w R
Opis kursu:
Podstawowym przeznaczeniem kursu jest wprowadzenie do środowiska R – olbrzymiego środowiska używanego na całym świecie do profesjonalnej analizy danych. Dedykowany jest przede wszystkim osobom rozpoczynającym przygodę z programem R i zaawansowaną analizą danych. Użytkownicy niepracujący wcześniej z danymi ilościowymi powinni (naszym zdaniem) najpierw dobrze poznać środowisko MS Excel. Zakres kursu obejmuje zapoznanie słuchaczy ze środowiskiem R i R-Studio, przedstawienie podstawowych pakietów do efektywnego przetwarzania i prezentowania danych oraz średniozaawansowanej wizualizacji graficznej wyników badań. W programie kursu znajduje się również statystyka opisowa i elementy statystycznej analizy danych.
Szczegółowa tematyka kursu:
- wprowadzenie do środowiska R i R-Studio: podstawowe operacje na obiektach, podstawowe komendy i funkcje, import/eksport danych, korzystanie z dokumentacji i plików pomocy, wyszukiwanie i ściąganie potrzebnych pakietów i informacji
- praca na tabelach danych (pakiety dplyr, tidyr): filtrowanie obserwacji, selekcja zmiennych, grupowanie i sumowanie obserwacji (tabele przestawne), przetwarzanie potokowe
- podstawowa wizualizacja danych (pakiet base): wykresy słupkowe, punktowe i liniowe, omówienie funkcji qplot() z pakietu ggplot2
- średniozaawansowana wizualizacja danych: pakiet lattice, wizualizacje 3d, przegląd wykresów, zasady efektywnej wizualizacji
- zaawansowane przetwarzanie danych: zarządzanie dużymi zbiorami danych, optymalizacja pracy z pakietem data.table, wizualizacja tabel danych (pakiet gridExtra), eksport wyników do plików jpeg, png i pdf
- ergonomia pracy w R: efektywne pisanie kodu, budowanie powtarzalnych i zautomatyzowanych kodów
- zastosowanie R w analizie statystycznej: analiza tendencji centralnej, analiza zmienności, rozkład statystyczny jednej zmiennej, wizualizacja i komunikacja wyników obliczeń
- Nauczyciel: Piotr Ćwiakowski