Przedsiębiorstwa

R - kurs wprowadzający

Poziom: dla początkujących

Czas trwania: 2x8h (2 dni)

  1. Podstawy pracy z R (omówienie interface’u i podstawowych funkcjonalności RStudio)
  2. Formaty danych, typy zmiennych
  3. Indeksowanie
  4. Data slicing and dicing/data preparation – podstawy dplyr
  5. Pętle – automatyzacja powtarzalnych zadań
  6. Funkcje
  7. Podstawy wizualizacji danych
  8. Zastosowanie narzędzi dplyr oraz ggplot2 – przetwarzanie potokowe
  9. Wykorzystanie AI (ChatGPT) w kodowaniu – przykłady, zalety i pułapki.

Wizualizacja danych - kurs podstawowy

Poziom: dla początkujących

Czas trwania: 2x8h (2 dni)

  1. Import danych (txt, csv, xlsx)
  2. Przygotowanie danych do analizy (tidyr, dplyr, srtingr, forcats)
  3. Podstawy poprawnej wizualizacji danych
  4. Zasady prezentacji wyników badań  – dopasowanie formy prezentacji
  5. Podstawy ggplot2Grammar of Graphics
  6. Przykładowe wykorzystanie ggplot2 – projekt do samodzielnego wykonania z pomocą prowadzącego
  7. Wykorzystanie AI (ChatGPT) w kodowaniu – przykłady, zalety i pułapki.

Wizualizacja danych - metody zaawansowane

Poziom: średniozaawansowany

Czas trwania: 2x8h (2 dni)

  1. Zasady optymalnej wizualizacji wyników badań,
  2. Dplyr + ggplot2
  3. Zaawansowane metody prezentacji danych (w zależności od skali zmiennych)
    1. Skala nominalna
    2. Skala porządkowa
    3. Skala interwałowa i ilorazowa
    4. Kombinacje dla zmiennych z różnych skal
    5. Analizy korelacyjne
    6. Heatmaps
    7. Mapy (podstawy)
  4. Wykorzystanie AI (ChatGPT) w kodowaniu – przykłady, zalety i pułapki.

Statystyka z R

Poziom: początkujący

Czas trwania: 2x8h (2 dni)

  1. przygotowanie danych
  2. Podstawowe statystyki
  3. Dplyr i przetwarzanie potokowe
  4. Wybrane zagadnienia z zakresu statystyki i wnioskowania statystycznego w R
    1. charakterystyki w grupach
    2. analizy jednej zmiennej
    3. analizy korelacji i regresji
    4. analiza szeregów czasowych
  5. Prezentacja wyników – ggplot2
  6. Wykorzystanie AI (ChatGPT) w kodowaniu – przykłady, zalety i pułapki.

Modelowanie statystyczne z R

Poziom: średnio zaawansowany (2 dni) oraz zaawansowany (3 dni) 

(wymagana przynajmniej podstawowa znajomość narzędzi statystyki i wnioskowania statystycznego)

Czas trwania: 2x8h (2 dni) lub 3x8h (3 dni) 

  1. Podstawy modelowania statystycznego
    1. Przygotowanie danych
    2. Decyzje, decyzje…  – jaki model? dlaczego?, jaki typ weryfikacji?
    3. Drzewo decyzyjne optymalnego wyboru modelu
  2. Regresja (prosta, wielokrotna)
  3. Regresja logistyczna
  4. Uczenie maszynowe
    1. Random Forest
    2. Sztuczne sieci neuronowe
  5. Weryfikacja jakości modeli
    1. Dla zmiennych ciagłych
    2. Dla zmiennych dyskretnych
  6. Wykorzystanie AI (ChatGPT) w kodowaniu – przykłady, zalety i pułapki.
Sleek laptop showcasing data analytics and graphs on the screen in a bright room.

R on-demand

Czas trwania:  zależny od zakresu kursu

Skomponuj własny zakres kursu zgodnie z Twoimi potrzebami.

Może zawierać on dowolne elementy składowe ze standardowej oferty jak również elementy znacznie poza nią wykraczające, np. Modelowanie zjawisk ekstremalnych z wykorzystaniem rozkładów teoretycznych, czy też Automatyzacja procesów raportowania.

Możliwości są w zasadzie nieograniczone. 

Gdzie diabeł nie może, tam się R zastosuje.

W sprawach trudniejszych, z niecierpliwością czekamy na możliwość wykazania się.

Magnifying glass and colored pencils on financial trend graphs highlighting sales growth.

Analiza danych

Analiza danych na zlecenie Zamawiającego

Czas trwania:  zależny od zakresu zlecenia

Przykładowy zakres analiz:

    • Eksploracja danych, wykrywanie trendów i anomalii.
    • Analizy statystyczne, prognozowanie
    • Modelowanie statystyczne, ewaluacja modeli
    • Przygotowanie wykresów i analiz dopasowanych do potrzeb firmy
    • Interaktywne dashboardy (R Shiny).