Spływające dwa razy dziennie informacje o liczbie zakażonych wirusem (SARS-CoV-2) podawane są z podziałem na województwa. Niemal od samego początku najwięcej zakażeń jest w województwie mazowieckim. Zaraz potem są województwa śląskie i dolnośląskie. Najmniej zakażonych jest w województwach lubuskim, warmińsko-mazurskim, opolskim i pomorskim. Czy to zróżnicowanie jest tylko i wyłącznie pochodną liczby ludności w województwach, a co za tym idzie, czy można uznać, że rozkład zakażeń jest w Polsce równomierny względem województw? Wyznaczony współczynnik korelacji dla zmiennych: liczba ludności województwa i liczba zakażeń w województwie (dane z tabeli 1) wynosi prawie 0,91 (dokładniej - 0,9092) i wskazuje na bardzo silną zależność tych dwóch zmiennych. Kwadrat współczynnika korelacji, czyli tak zwany współczynnik determinacji wynosi 0,8281 (82,66%), więc można uznać, że w 82,66 % liczbę zakażeń da się wyjaśnić liczbą ludności.
W zasadzie można by na tym poprzestać, gdyż tak wysoka korelacja pozwala na uznanie, że w bardzo dużym stopniu liczba zakażeń jest proporcjonalna do liczby ludności. Spróbujmy jednak poszukać, gdzie jest pozostałe 17,34%, które mają wpływ na liczbę zakażeń, a nie da się ich wyjaśnić liczbą ludności województwa. Oczywistym tropem wydaje się być gęstość zaludnienia poszczególnych województw. Współczynnik korelacji gęstości zaludnienia do gęstości zakażeń (iloraz liczby zakażeń i liczby ludności) wynosi 0,65 i rzeczywiście wskazuje na dużą zależność liniową tych zmiennych.
Dodatkowo, na widoczną w analizie większą niż przeciętna gęstość zakażeń w niektórych województwach mogą mieć wpływ takie czynniki jak ukształtowanie terenu (słabiej zaludnione lub niezamieszkałe tereny górskie w województwach południowych, co oznacza, że realna gęstość zaludnienia jest większa), czy duże skupiska ludności (województwo mazowieckie, śląskie, łódzkie, dolnośląskie).
Wnioski
Wstępna analiza rozkładu liczby zakażeń z podziałem na województwa i z uwzględnieniem gęstości zaludnienia w województwach pokazuje, że:
1. Liczba zakażeń jest w bardzo dużym stopniu skorelowana z liczbą ludności poszczególnych województw, czyli mówiąc inaczej jest w dużym stopniu proporcjonalna do liczby ludności.
2. Większą „gęstość zakażeń" da się w dosyć dużym stopniu wyjaśnić większą gęstością zaludnienia.
Na szczęście, z powodu zbyt małej liczby, nie ma możliwości przeprowadzenia podobnej analizy pod kątem liczby przypadków śmiertelnych. I oby taka możliwość się nie pojawiła.
P.S
Dorzucam ciekawą mapkę, zalinkowaną przez @J.a-kobieta (dziękuję) - https://www.google.com/maps/d/viewer?mid=1ALMh-_iOhBUnrJJNpc0_33f6NzFCICdg&ll=51.96192080955369%2C19.942856444742574&z=6
Inne tematy w dziale Rozmaitości