Analiza struktur przestrzennych jednostek administracyjnych-typologia i jej stabilność

Jerzy Hołubiec, Grażyna Petriczek

Istotnym elementem metody jest kryterium do testowania hipotezy o jednorodności zbioru danych. Funkcja kryterialna ma postać statystyki U o rozkładzie c2.. Metoda polega na iteracyjnym podziale niejednorodnego zbioru na dwie części. Jeżeli liczba tych podziałów (iteracji) wzrasta, to mogą pojawić się statystycznie niestabilne (nieistotne) granice między sąsiednimi podzbiorami. Agregacja takich podzbiorów oparta jest na badaniu odpowiednio skonstruowanej hipotezy dotyczącej stabilności granic między dwoma podzbiorami. Tak więc algorytm podziału zbioru danych składa się z dwóch etapów:

¨      Podział zbioru na jednorodne, rozłączne podzbiory - pierwotny podział zbioru

Algorytm podziału na grupy jednorodne ma postać następującą:

1) dla uszeregowanego względem najbardziej charakterystycznych cech zbioru danych X = {Xi}, i=1,...,n, obliczamy statystyki: U(1,n-1), U(2,n-2),...., U(l,n-l),.., U(n-1,1)

2) wybieramy największą wartość statystyki U

3) dzielimy zbiór S na dwa podzbiory S1 ,S2 zawierające odpowiednio l1 pierwszych elementów i n-l1 pozostałych elementów.

4) Dla każdego z otrzymanych podzbiorów testujemy następnie hipotezę o jego jednorodności. Jeżeli którykolwiek z nich nie jest zbiorem jednorodnym, to dzielimy go na dwie części zgodnie z największą wartością statystyki U.

5) proces ten powtarzamy dopóty dopóki wszystkie otrzymane w wyniku kolejnych podziałów podzbiory nie będą spełniały hipotezy jednorodności

¨      Badanie stabilności granic między tymi podzbiorami

Statystyczną stabilność granic między podzbiorami można badać porównując średnie wielowymiarowe. Jeżeli są one statystycznie równoważne, można założyć, że granica jest niestabilna i rozdzielane przez nią grupy można połączyć nie naruszając jednorodności.

Badania stabilności granic między grupami sprowadza się do weryfikacji odpowiednio sformułowanej hipotezy.

 

Omówiony algorytm był zastosowany do analizy struktur regionalnych w Polsce w latach 1998 oraz 2000 i 2001. A więc uwzględniono dawny podział na 49 województw oraz nowy na 16 województw. Zadanie polegało na wyodrębnieniu jednorodnych grup województw ze względu na wybrane cechy.

Rozważono następujące przypadki:

a)      3 cechy :ludność , zatrudnienie, nakłady inwestycyjne

b)      5 cech: ludność, zatrudnienie, nakłady inwestycyjne, produkcja przemysłowa, zasoby mieszkaniowe

c)      9 cech: ludność, zatrudnienie, nakłady inwestycyjne, produkcja przemysłowa, zasoby mieszkaniowe, produkcja budowlano-montażowa, użytki rolne, bezrobocie, miejsca noclegowe

Słowa kluczowe: jednorodność zbioru danych, statystyka U, statystycznie stabilne granice między grupami danych, analiza regionalna.

Strzałka w lewoSpis referatów, Pełny tekst PDF