Źródła danych i metodologia
Skąd pochodzą dane prezentowane na EpiData.pl i jak są przetwarzane.
NIZP-PZH
Narodowy Instytut Zdrowia Publicznego – Państwowy Zakład Higieny
Zasięg
Polska, dane krajowe
Częstotliwość aktualizacji
Dwumiesięczne (raporty A i B)
Dostępne dane
- –Salmoneloza (ogółem, zatrucie pokarmowe, posocznica, inne)
- –Grypa i podejrzenia grypy / grypa potwierdzona laboratoryjnie (od 2023)
- –COVID-19 (potwierdzone i możliwe)
- –Choroba meningokokowa inwazyjna (ogółem, zapalenie opon, posocznica)
- –WZW A, WZW B (ogółem i ostre), WZW C (ogółem i ostre)
- –Krztusiec
- –Odra
- –Gruźlica
Metodologia
- ·Dane oparte na zgłoszeniach przypadków do Państwowej Inspekcji Sanitarnej (SANEPID).
- ·Raporty publikowane ~15. i ~ostatniego dnia każdego miesiąca jako dokumenty PDF.
- ·Parser automatycznie pobiera i przetwarza raporty dwa razy w miesiącu.
Ograniczenia
- ⚠Dane dla grypy: do 2022 r. obejmowały zarówno potwierdzone przypadki, jak i podejrzenia (miliony). Od 2023 r. wyłącznie przypadki spełniające definicję UE (tysiące). Dane z obu okresów nie są bezpośrednio porównywalne.
- ⚠Liczba przypadków może być korygowana wstecznie w późniejszych raportach.
WHO GHO
World Health Organization — Global Health Observatory
Zasięg
Dane globalne, w tym Polska
Częstotliwość aktualizacji
Roczne
Dostępne dane
- –Gruźlica — wskaźnik zapadalności na 100 tys. mieszkańców
- –Odra — wskaźnik zapadalności na 100 tys. mieszkańców
- –Krztusiec — wskaźnik zapadalności na 100 tys. mieszkańców
Metodologia
- ·Dane pobierane przez API GHO w formacie JSON.
- ·WHO agreguje dane z krajowych systemów nadzoru epidemiologicznego.
- ·Synchronizacja automatyczna co tydzień (dane aktualizują się rzadko — raz do roku).
Ograniczenia
- ⚠WHO GHO zawiera wyłącznie zapadalność (na 100 tys.), bez bezwzględnej liczby przypadków.
- ⚠Dane mogą różnić się od NIZP-PZH ze względu na odmienną metodologię raportowania i korekty wsteczne WHO.
Eurostat
Urząd Statystyczny Unii Europejskiej
Zasięg
Kraje UE, w tym Polska
Częstotliwość aktualizacji
Roczne
Dostępne dane
- –Zgony z przyczyn zakaźnych — wybrane choroby (dataset hlth_cd_acdr2)
Metodologia
- ·Dane pobierane przez Eurostat API w formacie JSON.
- ·Eurostat agreguje dane z krajowych urzędów statystycznych.
- ·Synchronizacja automatyczna co tydzień.
Ograniczenia
- ⚠Wartości zgonów dla wybranych chorób i lat mogą być zaniżone lub maskowane ze względu na ochronę danych statystycznych (small number suppression).
- ⚠Dane o zgonach nie są porównywalne z danymi o przypadkach z NIZP-PZH — to różne wskaźniki z różnych rejestrów.
GUS BDL
Główny Urząd Statystyczny — Bank Danych Lokalnych
Zasięg
Polska — poziom krajowy i wojewódzki
Częstotliwość aktualizacji
Roczne
Dostępne dane
- –Zaburzenia alkoholowe — uzależnieni od alkoholu
- –Plan: choroby psychiczne, zachorowania na choroby zakaźne
- –Plan: zachorowania na gruźlicę wg wieku
Metodologia
- ·Dane pobierane przez GUS BDL API v1 w formacie JSON.
- ·BDL agreguje dane z systemu statystyki publicznej (sprawozdania GUS).
- ·Wskaźniki przeliczone do jednostki: na 100 tys.
Ograniczenia
- ⚠BDL prezentuje wskaźniki zagregowane (na 1000/10 tys./100 tys.), nie zawsze bezwzględne liczby przypadków.
- ⚠Niektóre wskaźniki dostępne tylko na poziomie krajowym, inne także dla województw.
KRN
Krajowy Rejestr Nowotworów
Zasięg
Polska — krajowo i wojewódzko
Częstotliwość aktualizacji
Roczne
Dostępne dane
- –Plan: rak płuca, rak piersi, rak jelita grubego, rak prostaty
Metodologia
- ·KRN to centralny rejestr onkologiczny prowadzony przez Centrum Onkologii.
- ·Plan: parser PDF analogiczny do NIZP-PZH.
Ograniczenia
- ⚠Raporty publikowane z ~2-letnim opóźnieniem (najnowsze dostępne dane to typowo rok N-2).
- ⚠Dane w trakcie integracji — sprawdź status w kategorii Nowotwory.
ICD-10
Międzynarodowa Klasyfikacja Chorób i Problemów Zdrowotnych (WHO / CSIOZ)
Zasięg
Globalny
Częstotliwość aktualizacji
Statyczny (rewizja X, wydanie 2008)
Dostępne dane
- –Słownik 1959 kodów 3-znakowych ICD-10 (A00–Z99 + U00–U89)
- –Oficjalne nazwy polskie i angielskie chorób
- –Używany do wyświetlania oficjalnych nazw ICD-10 na stronach chorób
Metodologia
- ·Dane z polskiego wydania ICD-10 Tom I (CSIOZ 2012, bazujące na WHO 2009).
- ·Słownik wygenerowany przez scripts/icd10_parser.py z pliku PDF klasyfikacji.
- ·Używany wyłącznie server-side — nie trafia do bundle klienta.
Ograniczenia
- ⚠Rewizja X z 2008 roku — nie uwzględnia poprawek z ICD-11 (WHO 2022).
- ⚠Nazwy polskie z wydania CSIOZ 2012 — mogą różnić się od nowszych tłumaczeń.
NFZ
Narodowy Fundusz Zdrowia
Zasięg
Polska — wszystkie województwa
Częstotliwość aktualizacji
Kwartalne / roczne
Dostępne dane
- –Plan: zawały, udary, nadciśnienie, cukrzyca, astma, POChP, depresja
Metodologia
- ·NFZ Statystyka Świadczenia (JGP) — liczba świadczeń medycznych.
- ·Plan: integracja w drugiej fazie ekspansji EpiData.
Ograniczenia
- ⚠NFZ liczy świadczenia (wizyty/hospitalizacje), a nie unikalnych pacjentów — rzeczywista liczba chorych jest niższa niż liczba świadczeń.
- ⚠Dane obejmują tylko świadczenia rozliczane przez NFZ (~96% populacji).
Uwagi do poszczególnych chorób
Uwaga: dane do 2022 r. obejmują grypę i podejrzenia grypy (miliony przypadków). Od 2023 r. NIZP-PZH raportuje wyłącznie przypadki potwierdzone laboratoryjnie zgodnie z definicją UE (tysiące przypadków). Dane z obu okresów nie są bezpośrednio porównywalne.
Dane GUS BDL liczą przypadki wg roku rozpoznania. Raporty NIZP-PZH podają wyższe liczby, bo uwzględniają też przypadki rozpoznane wcześniej, a zgłoszone z opóźnieniem (np. w 2024 r. GUS: 2 008, NIZP-PZH: 2 257 — różnica to 244 przypadki zgłoszone z opóźnieniem). AIDS to podgrupa HIV — suma HIV+AIDS przekracza HIV ogółem, ponieważ AIDS liczy przypadki pełnoobjawowe, a nie nowe zakażenia. Dane HIV od 2019 r., AIDS od 1999 r.
Inne bakteryjne zatrucia pokarmowe
Agregat bakteryjnych zatruć pokarmowych (A05) — nie obejmuje salmonelloz ani szigelozy, które są raportowane osobno. Dane GUS BDL 1999–2024.
Zakażenie Clostridioides difficile
Dane GUS BDL P1789 — zachorowania na zapalenie jelit wywołane przez C. difficile. Dane dostępne od ~2015 r. Liczba rzeczywistych zakażeń jest wyższa ze względu na niedodiagnozowanie w POZ.
Inwazyjne zakażenia bakteryjne
Dane GUS BDL P1789 — inwazyjne zakażenia S. pneumoniae (pneumokok) i H. influenzae. Dane dostępne od ~2022 r. Inwazyjne = posiewy krwi lub PMR.
Pandemia COVID-19 (2020): Dla większości chorób zakaźnych rok 2020 charakteryzuje się znacznym spadkiem liczby raportowanych przypadków w związku z ograniczeniami epidemicznymi, zamknięciem placówek medycznych i zmniejszoną liczbą kontaktów społecznych. Na wykresach zaznaczono ten rok pionową linią.