📋 STRATEGY BRIEF — ZAUFANIE DO DANYCH

SHOWCASE

🎯 Co to pokazuje

Transparentność metodologii — skąd pochodzą dane, jak świeże są obserwacje, które trasy mają pełne pokrycie, a które luki. Widok „za kulisami" buduje wiarygodność systemu przed zarządem i audytorami; zgodny z zasadą „każdy fakt ma źródło".

📊 Status danych

✅ 442 193 punktów danych, 3 aktywnych przewoźników, ostatnia aktualizacja 2 godziny temu, 46 monitorowanych tras. Metadane świeżości dostępne przez /api/freshness i monitor.py freshness.

🛠️ Nakład pracy

Niski — dane o świeżości już istnieją w bazie. UI to statyczna strona z tabelami pokrycia i harmonogramem cron. Największy nakład to opracowanie narracji wyjaśniającej ograniczenia (np. brak PLK w codziennym cron).

👥 Rezonans z zarządem

Średni dla codziennych użytkowników, wysoki przy onboardingu nowych decydentów. Pokazuje, że system nie jest czarną skrzynką — widoczne luki w danych są lepsze od ukrytych. Wzmacnia zaufanie do pozostałych widoków dashboardu.

💡 Moja rekomendacja

Wdrożyć jako podstronę „O danych" dostępną z każdego widoku dashboardu (link w stopce). Nie eksponować jako główny ekran — to narzędzie pomocnicze, nie analityczne.

🔜 Kolejne kroki

1. Dodać automatyczny alert gdy świeżość któregoś przewoźnika przekroczy 48 godzin. 2. Rozbudować tabelę pokrycia o kolumnę „ostatnia anomalia". 3. Powiązać statusy źródeł z dokumentacją API.

Źródła danych i jakość

Za kulisami dashboardu — pełna przejrzystość w zakresie pochodzenia danych o rynku kolejowym, częstotliwości aktualizacji i niezabezpieczonych obszarów.

Zebrane punkty danych
442 193
NA ŻYWO
Aktywni przewoźnicy
3 z 4
1 NIEAKTYWNY
Ostatnia aktualizacja
2 godz. temu
ŚWIEŻE
Pokrycie
46 tras
5 KORYTARZY

Skąd pochodzą nasze dane

Źródło Przewoźnik Co zbieramy Uwierzytelnienie Ostatni sukces
RegioJet Public API RegioJet (RJ) Ceny, liczba miejsc, rozkład Brak (publiczne) 2 godz. temu ✓
Koleo API PKP Intercity (EIC/IC/EIP) Ceny, obłożenie, rozkład Opcjonalne (1. klasa) 2 godz. temu ✓
Leo Express GraphQL Leo Express (LEO) Ceny, liczba miejsc, rozkład Brak 3 godz. temu ✓
PKP PLK Official API Wszyscy przewoźnicy Rozkłady, odkrywanie tras Klucz API wymagany 49 dni temu ⚠
⚠ Pamięć podręczna PLK nieaktualna — pamięć podręczna odkrywania tras PLK jest nieaktualna (49 dni od ostatniego odświeżenia). Dane cenowe nie są naruszone — dotyczy to wyłącznie automatycznego wykrywania nowych połączeń kolejowych. Zespół techniczny jest poinformowany i ma to w planie działań.

Kiedy zbieramy dane

Codziennie 05:00 UTC (06:00 czas polski)
Pełne pobieranie cen dla 8 dat: dziś, +1d, +3d, +7d, +14d, +30d, +60d, +90d
Obejmuje ceny dla wszystkich okien rezerwacyjnych. Daty odległe (>30 dni) ponownie pobierane co tydzień przez logikę nieświeżości. Zawiera 1-sekundowy odstęp między wywołaniami API.
Niedziela 04:30 UTC (05:30 czas polski)
Automatyczne odkrywanie miast
Sprawdza RegioJet, Koleo i Leo Express pod kątem nowych stacji i tras. Automatycznie aktualizuje wewnętrzne mapowania miast.
Niedziela 02:00 UTC (03:00 czas polski)
Odświeżanie pojemności pociągów
Aktualizuje łączną liczbę miejsc na klasę pociągu. Używane do obliczania procentowego obłożenia.
Codziennie 20:00 UTC (21:00 czas polski)
Raport stanu zdrowia przez Telegram
Podsumowanie skuteczności API, liczby błędów i świeżości danych — wysyłane do zespołu operacyjnego.

Co obejmujemy — i czego nie obejmujemy

Korytarz RegioJet PKP IC Leo Express Koleje Dolnośląskie
Warszawa → Kraków ✓ Pełne ✓ Pełne ✓ Pełne
Warszawa → Poznań ✓ Pełne ✓ Pełne
Gdynia → Warszawa ✓ Pełne ✓ Pełne
Warszawa → Praha ✓ Pełne ✓ Pełne
Praha → Przemyśl ✓ Pełne ✓ Pełne
Znane luki:
  • Ceny PKP IC w 1. klasie wymagają logowania do Koleo i nie są zbierane we wszystkich przypadkach
  • Koleje Dolnośląskie (KD) są rozpoznawane w systemie, ale nie wdrożono jeszcze zbierania danych
  • Tabele plk_operations (opóźnienia w czasie rzeczywistym) i plk_disruptions są obecnie puste — endpointy API zdefiniowane, ale zbieranie danych nie jest aktywne

Wskaźniki jakości danych

Skuteczność API (30 dni)
98,4%
Śr. dla wszystkich źródeł
Śr. czas pobierania
2,3 sek.
Na odświeżenie 8 dat
Liczba błędów (ostatnie 7 dni)
2 208 przejściowych IC
Normalne zdarzenia przejściowe Koleo, ponawiane automatycznie

Nie ufaj nam — weryfikuj

Każda liczba na naszych dashboardach może być zweryfikowana bezpośrednio w oryginalnym źródle:

  1. Porównaj ceny — odwiedź regiojet.pl, intercity.pl lub leoexpress.com i wyszukaj tę samą datę/trasę
  2. Sprawdź rozkłady — rozkłady jazdy polskich operatorów kolejowych są publiczne na portalpasazera.pl
  3. Zażądaj dostępu do API — nasza baza danych jest dostępna przez REST API do weryfikacji technicznej
  4. Pełny dziennik audytu — każde wywołanie API jest rejestrowane z sygnaturą czasową, wynikiem i czasem trwania (tabela fetch_log)

Nasze dane to migawka wykonana w określonych momentach. Ceny na stronach przewoźników zmieniają się co minutę, więc niewielkie różnice są normalne — ale nasze trendy i porównania względne pozostają dokładne.

Uzasadnienie projektu — Zaufanie do danych i proweniencja

Ten widok odpowiada na pytanie zarządu z „Fali 1": „Czy te dane są prawdziwe? Skąd pochodzą? Czy można im ufać?"

Podstawa badań:

  • Wywiady z zarządem konsekwentnie pokazują, że pytania o zaufanie pojawiają się w ciągu pierwszych 60 sekund każdej demonstracji
  • Badania nad dashboardami dla kadry zarządzającej (Qualtrics ACDD): przejrzystość w kwestii ograniczeń buduje zaufanie, a nie zwątpienie
  • Literatura o zaufaniu organizacyjnym: przyznanie, czego się nie wie, jest silniejszym sygnałem wiarygodności niż twierdzenie o kompletności

Zastosowane wzorce:

  • Tabela źródeł z ujawnieniem metod uwierzytelniania — wyjaśnia dokładnie, jak uzyskujemy dostęp do każdego API
  • Sygnatury czasowe ostatniego sukcesu dla każdego źródła — świeżość na pierwszy rzut oka
  • Wyraźne ujawnienie znanych problemów — nieaktualna pamięć PLK, brak danych KD, luki w 1. klasie — to buduje zaufanie
  • Widoczność harmonogramu aktualizacji — przewidywalność to zaufanie
  • Wezwanie „Nie ufaj nam — weryfikuj" — aktywnie zachęca do sceptycyzmu z jasnymi ścieżkami weryfikacji
  • Macierz pokrycia — jednoznacznie informuje, czego nie obejmujemy

Kiedy używać tego widoku:

To jest strona, którą otwierasz JAKO PIERWSZĄ, gdy zarząd pyta „Skąd pochodzą te dane?" — i nigdy nie powinieneś potrzebować kolejnego wyjaśnienia.