BluePink XHost |
Servere virtuale de la 20 eur / luna. Servere dedicate de la 100 eur / luna - servicii de administrare si monitorizare incluse. Colocare servere si echipamente de la 75 eur / luna. Pentru detalii accesati site-ul BluePink. |
Introducere
Statistica spatiala studiaza populatiile statistice cu dispunere a esantioanelor într-un anumit spatiu. Când spatiul de dispunere este spatiul tridimensional terestru, disciplina de studiu se numeste geostatistica. În cadrul acestui domeniu ne vom ocupa doar de câteva metode de interpolare, aplicabile multor fenomene geografice. Sunt prezentate acele metode de interpolare din statistica ce sunt folosite mult în SIG si în cartografierea tematica. Este adaugat si un glosar de termeni ai statisticii spatiale si o bibliografie extinsa din literatura americana. Mult mai multe informatii de statistica geografica puteti gasi la situl AI-GEOSTATS.
Definitii:
O mozaicare a unui plan este umplerea planului prin repetarea unor figuri (poligoane), astfel ca figurile sa nu se acopere si sa nu existe goluri. Numarul n de laturi ale poligonului acoperitor este 3 < n < infinit, dar practic le limitam la triunghiuri, patrulatere, pentagoane si hexagoane. Aceste poligoane pot fi regulate sau neregulate. Operatiunea de mozaicare sau parchetare apartine matematicii teserale.
Operatiunea duala a unei mozaicari (parchetare sau in limba engleza tessellation) este o alta mozaicare, obtinuta prin unirea centrelor poligoanelor din mozaicarea originala si care impart o frontiera comuna. De exemplu, mozaicul dual al unui mozaic de triunghiuri echilaterale este un mozaic de hexagoane regulate.
Data fiind in planul euclidian o multime de doua sau mai multe puncte distincte in numar finit, toate pozitiile din acel spatiu sunt asociate cu cele mai apropiate puncte din multimea data. Rezultatul este o mozaicare a planului intr-o multime de regiuni asociate cu elementele multimii de puncte, care e denumita diagrama plana ordinara Voronoi. Regiunile sunt denumite poligoane Voronoi ordinare.
Data fiind o diagrama Voronoi unde generatoarele (punctele pi) in numar de trei sau mai multe, dar in numar finit, necolineare, sunt unite toate pe perechi de puncte ale caror poligoane Voronoi au o frontiera comuna. Rezulta o a doua mozaicare. Daca aceasta mozaicare consta numai din triunghiuri, este denumirea triangulatie Delaunay.
Interpolarea spatiala implica gasirea unei functii f(x, y) care reprezinta intreaga suprafata a valorilor z asociate cu puncte (x, y) dispuse neregulat. In plus, aceasta functie face o predictie a valorilor z pentru alte pozitii dispuse regulat. O asemenea functie este cunoscuta ca functie de interpolare. Exista doua tipuri de functii de interpolare, exacte si aproximative (netezirea datelor). Se deosebesc si functiile de interpolare locale si globale.
Exemplu: Fie o suprafata discontinua de puncte care au valorile tematice codificate de la A la E. Mai intai este creata o diagrama Voronoi si apoi frontierele poligoanelor adiacente (vecine) care au aceeasi valoare tematica sunt excluse sau dizolvate. Poate fi afisata harta suprafetei finale folosind cateva hasuri sau esantioane de umplere.
Fig. 7.1 Pozitiile punctelor si valorile tematice z
Fig. 7.2 Diagrama Voronoi (poligoanele vecine)
Fig. 7.3 Harta suprafetei tematice finale
Metoda interpolarii dupa vecinul natural - este potrivita cand se doreste a se estima o valoare z care lipseste intr-o pozitie, din cele din alte pozitii.
Pentru a reprezenta o suprafata definita de valorile z in puncte (x,y) dispuse la intervale neregulate, pot fi folosite triunghiurile formate de punctele in care sunt cunoscute valorile z. Acest proces ofera cateva avantaje fata de grila regulata. La un MDA (model digital altimetric) reteaua este denumita TIN (triangular irregular network). In final suntem interesati in reprezentarea in primul rand a izocurbelor.
Fig. 7.4 Diagrama 3-D
Rutinele de reprezentare la ploter a curbelor de nivel si a suprafetei 3-D intr-un SIG necesita ca punctele (x,y,z) sa fie dispuse intr-o grila. Punctele (x,y,z) pot apartine unei grile regulste sau unei grile neregulate. Datele initiale dispuse neregulat pot fi folosite pentru a se determina mai intai o grila regulata cu valorile z interpolate din cele existente. Exista numeroase metode matematice ce pot fi folosite pentru generarea grilei regulate de puncte cu noi date. Cateva metode sunt:
Toate metodele de generare a grilei sunt aproximari si pot genera erori, existand limitari inerente ale diferitelor metode matematice. Precizia interpolarii depinde mult de frecventa si distributia spatiala a datelor initiale. Nu exista o metoda considerata cea mai buna. Pentru fiecare tip de variabila si tip de dispunere a punctelor, pentru diferite rugozitati ale suprafetei, se pot determina experimental cele mai optime metode sau parametrii acestora.
C1 Spline
Initial un spline era o rigla
flexibila, folosita de proiectanti si desenatori. O functie
spline este echivalentul
matematic al acestei rigle flexibile. Ele sunt functii pe
intervale sau domenii mici, care aproximeaza o linie sau o
suprafata curba printr-un sir de segmente de dreapta potrivita
intr-un numar smic de puncte. Legaturile intre o parte a curbei
si alta sunt continui. Aceasta inseamna ca cu splinuri este
posibil sa se modifice o parte a curbei fara a trebui sa se
recalculeze intreaga curba. Daca o functie
z(i) = pi(xi, yi), unde i = 1,.., n sunt punctele laticei sau retelei
si pi(xi, yi) = polinoame de ordin m, pentru m = 1, 2 sau 3
C1 este continua, adica derivatele partiale dz/dx si dz/dy sunt continue in tot domeniul grilei (retelei sau laticei), fiind un "spline C1". O interpolare C1 a suprafetei are proprietatea ca nu exista discontinuitati si in general rezulta o harta cu izohipse netede, estetice. In regiuni cu date imprastiate cu "varfuri" si "vai" in exces, grilele pot fi generate cu seturi de date diferite. Numarul punctelor apropiate folosite pentru calculul derivatelor partiale in fiecare punct al laticei poate fi de regula specificat, pentru a reduce procesul de interpolare.
Interpolarea liniara
Interpolarea liniara se bazeaza pe metoda
triangulatiei Thiessen. Baza procedurii este sa se uneasca intr-o
retea de triunghiuri punctele (x,y,z) vecine dispuse neregulat.
Cele trei puncte unite ale fiecarui triunghi determina un plan.
Din fiecare punct al laticei se duce o linie verticala (x
si y constante). Intersectia liniei verticale cu planul
format de varfurile triunghiului defineste valoarea z a
suprafetei in fiecare punct (x,y) al grilei latice.
Metoda mediei (aritmetice) ponderate deplasabile
pentru o multime a punctelor unei grile sunt calculate valorile functiei z(xi, yi) = f(xi, yi), ca valoare medie ponderata a valorilor z ale unor puncte vecine distribuite neregulat. Ponderea fiecarei valori z este raportul 1/(dij**r), unde dij este distanta de la punctul de interpolat la punctul de cota data, iar r este un exponent real -definit de utilizator in intervalul [1 - 4]. Sunt definite o raza de cautare si numarul de puncte ce se vor folosi pentru a calcula fiecare valoare z dintr-un punct al retelei. Daca in domeniul definit de raza nu sunt gasite punctele in numarul specificat de utilizator, punctului grilei i se atrinuie o valoare masca. Aceasta metoda tinde sa produca zone orizontale plane in regiunile fara date. Deoarece metoda foloseste interpolarea pe baza inversului distantei, interpolarea este exacta. Rezulta valori infinite ale ponderii atunci cand å dij = 0 (in punctul cu cota data), asa ca atunci cand coordonatele unui punct al grilei sunt egale cu cele ale unui punct cu valoare z date, nu se fac calcule si este atribuita punctului grilei valoarea din punctul dat. Forma finala a hartii rezultate depinde mult de valoarea razei r, de numarul si dispunerea punctelor cu valori z date.
7.2 Teoria variabilei regionalizate
Pentru metodele geostatistice de interpolare, se recunoste ca variatia spatiala a oricarui atribut continuu este de multe ori destul de neregulata pentru a fi modelata de o functie matematica simpla de netezire. In schimb, variatia poate fi descrisa mai bine de o suprafata stohastica. Atributul este denumit variabila regionalizata. Interpolarea cu geostatistici este cunoscuta drept kriging, dupa D.G. Krige. Teoria variabilei regionalizate considera ca variatia spatiala a oricarei variabile poate fi exprimata ca suma a trei componente. Valoarea unei variabile aleatoare Z in x este data de:
Z(x) = m(x) + e (x) + e " ............... (1)
unde m(x) este
functia determinista care descrie componenta "structurala"
a lui Z
e(x)
este eroarea stohastica, dependenta spatial de m(x)
e"este
"zgomotul" gaussian (eroare), independent spatial
Observatie: Z este o functie aleatoare si nu un atribut z masurat .
Prima sarcina este de a defini o functie pentru determinarea lui m(x). Cand nu este prezenta o tendinta, m(x) este egala cu valoarea medie din zona de esantionare si diferenta medie intre oricare doua pozitii x si x+h va fi zero. Variabilitatea din spatiul datelor este caracterizata de semivarianta, care este o masura a deviatiei dintre perechile de valori z la o anumita distanta si pe o anumita directie. Semivarianta este definita de:
gamma(h) = 1/2 E{[Z(x) - Z(x + h)]2} ............... (2)
unde x este o pozitie si h este un vector al distantei. Se considera ca: 1) gamma este o functie numai de distanta h si nu de pozitia x; 2) exista stationariatea diferentei; aceasta este denumita poteza intrinseca. Facand aceste presupuneri, este necesar sa avem numai o semivariograma, care poate fi folosita in interpolarea punctelor grilei. Odata ce efectele structurale au fost considerate, variatia ramasa este omogena, astfel ca diferentele dintre pozitii sunt o functie numai de distanta dintre ele. Inlocuind relatia (2) in relatia (1), rezulta:
Z(x) = m(x) + gamma(h) + e " ................................(3)
Daca sunt indepliniteconditiile specificate de ipoteza intrinseca, semivarianta poate fi estimata din datele initiale cu:
gamma(h) = 1/2n å [Z(x) - Z(x + h)]2 ..................(4)
Metoda necesita cunostinte extensive ale utilizatorului si ca atare este putin folosita. Cand este utilizata incorect, aceasta metoda genereaza date incorecte sau de nefolosit . Kriging este o metoda a mediei ponderate de determinare a valorilor z in punctele unei grile, ponderile fiind determinate pe baza pozitiei datelor si a gradului de continuitate spatiala prezent in date, prin determinarea semivariogramei. Ponderile sunt determinate astfel incat eroarea medie a estimarii este zero si varianta estimarii este minima (principiul sumei minime a patratelor erorilor sau principiul celor mai mici patrate).
Exista doua tipuri de metode kriging - obisnuita sau ordinara si universala. Cu prima (ordinary kriging), valoarea asteptata a tendintei subliniate a lui z este considerata a fi constanta pe domeniul intregii grile (x,y), pe cand la cea de a doua se permite specificarea unei abateri polinomiale ce descrie tendinta subliniata in date, daca aceasta se cunoaste. Metoda kriging universala este cunoscuta si ca asimetrie kriging de ordin k.
Poate fi specificat un numar de termeni teoretici ai variogramelor si tendintei.
O semivariograma este reprezentatea grafica a functiei gamma (h) fata de lag (h), de exemplu semivarianta fata de distanta. In mod uzual, gamma creste cu cresterea lui h, indicand mai mult o deviatie, decat o corelatie intre valorile z cu cresterea distantei. Exista adesea cazul ca dupa o anumita distanta (a), denumita interval (range), gamma se niveleaza la o valoare (C0 + C1), denumita prag (sill). Ca atare, intervalul este distanta dincolo de care deviatia valorii z nu depinde de distanta si valorile z nu mai sunt corelate.
Fig. 7.5 Semivariograma
Pentru a usura alegerea unui model teoretic de semivariograma potrivita datelor particulare, este construita intai o semivariograma experimentala.
Pentru a calcula semivariograma experimentala, datele sunt impartite in clase de distante denumite defazari (ags). Numarul de clase si dimensiunea acestora trebuie specificate de utilizator. O estimare a lui gamma este facuta pentru fiecare clasa. Pentru fiecare pereche de puncte cu z separate este folosit un vector de directie (alpha + toleranta) si lungime h + Dh, pentru a estima valoarea lui gamma (h, alpha) cu functia:
gamma*(h,alpha) = 1/2 N' E [z(x1i) - z(x2i)]2, i = 1,.., N' ..(5)
unde N' este numarul de perechi de date care satisfac criteriul de selectie, iar x1 si x2 sunt membri ai perechilor de date.
Observatie: Un numar optim de clase este 20. Pentru ajutor in determinarea dimensiunii clasei, asigurati-va ca distanta totala peste care este calculata gamma este egala cu numarul de clase inmultit cu dimensiunea fiecarei lag (h) si ca aceasta distanta ar trebui sa cuprinda cel putin jumatate din multimea de date .
Modele teoretice de semivariograme
Exista cinci modele diferite ce pot fi potrivite pentru semivariogramele experimentale. Aceste modele pot fi categorisite dupa prezenta sau absenta unui prag si de comportarea in origine, care este fie liniara, fie parabolica. In plus, poate exista o discontinuitate in origine, asa numitul efect de pepita (nugget). Aceasta inseamna ca modelul de aproximare nu trece prin origine, dar intersecteaza axa y la o valoare pozitiva a lui gamma(h), notata C0. Aceasta cantitate este o estimare a lui e", eroarea reziduala, care reprezinta zgomotul spatial necorelat asociat cu orice valoare in x a unei variabile aleatoare Z. Alegerea semivariogramei theoretice este determinata mult de experienta utilizatorului si de experimentarile facute anterior.
Cele cinci modele sunt:
a) sferic
gamma(h) = 3/2(h/a) - 1/2(h/a)^3 pentru 0 < h < a, unde h = lag sau distanta in spatiul x, y ..(6)
b) cubic
gamma(h) = 7(h/a)^2 - 35/4(h/a)^3 + 7/2(h/a)^5 - 3/4(h/a)^7 pentru 0 < h < a ......................(7)
Observatie: ambele modele a) si b) ating un prag la intervalul a si comportarea in origine este liniara.
c) exponential
gamma(h) = 1 - exp(-(h/a)) .................................................................................................... (8)
d) Gaussian
gamma(h) = 1 - exp(-(h/a)^2) ................................................................................................. (9)
Observatie: ambele modele c) si d) ating un prag asimptotic, iar comportarea in origine este parabolica. Intervalul efectiv pentru modelul c) este 3a, pe cand cel pentru modelul d) este aÖ3
e) liniar
gamma(h) = f * h^g , unde f > 0 si 0 < g < 2 ......................................................................... (10)
Incorporarea unei abateri cunoscute
Daca exista o anumita tendinta cunoscuta sau o abatere in date si daca aceasta tendinta poate fi specificata in forma unui polinom, atunci poate fi aplicata metoda kriging universala. Functia este exprimata ca:
Z(x) = m(x) + Y(x) .............................................................................................................. (11)
unde m(x) este tendinta si Y(x) reprezinta erorile reziduale.
Problema: Determinati valoarea z in punctul (x = 5, y = 5), folosind ponderile kriging.
Fig. 7.6 Dispunerea punctelor cu valori z cunoscute si a punctului de interpolat
Rezolvare: Fie variatia spatiala a valorilor z in cinci puncte, reprezentata de o variograma sferica cu C0 = 2,5, C1 = 7,5 si intervalul a = 10,0. Datele in cele cinci puncte alese sunt:
Distantele () intre puncte sunt: | |||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
i | x | y | z | i | 0 | 1 | 2 | 3 | 4 | 5 | |||||||||||||
1 | 2 | 2 | 3 | 1 | 4.243 | 0.0 | 5.099 | 9.899 | 5.000 | 3.162 | |||||||||||||
2 | 3 | 7 | 4 | 2 | 2.828 | 5.099 | 0.0 | 6.325 | 3.606 | 4.472 | |||||||||||||
3 | 9 | 9 | 2 | 3 | 5.657 | 9.899 | 6.325 | 0.0 | 5.000 | 7.211 | |||||||||||||
4 | 6 | 5 | 4 | 4 | 1.000 | 5.000 | 3.606 | 5.000 | 0.0 | 2.236 | |||||||||||||
5 | 5 | 3 | 6 | 5 | 2.000 | 3.162 | 4.472 | 7.211 | 2.236 | 0.0 |
Observatie: i = 0 arata punctul de determinat (x = 5, y = 5)
Exista relatia | pentru 0 < h < a | |
g(h)= | pentru h ³ a |
Inlocuind distantele (h) de mai sus in variograma, rezulta urmatoarele semivariograme:
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 6.9869 | 2.500 | 7.739 | 9.999 | 7.656 | 5.939 | 1.000 | |||||||||
2 | 5.5967 | 7.739 | 2.500 | 8.667 | 6.381 | 7.196 | 1.000 | |||||||||
3 | 8.1852 | 9.999 | 8.667 | 2.500 | 7.656 | 9.206 | 1.000 | |||||||||
4 | 3.6212 | 7.656 | 6.381 | 7.656 | 2.500 | 4.936 | 1.000 | |||||||||
5 | 4.720 | 5.939 | 7.196 | 9.206 | 4.936 | 2.500 | 1.000 | |||||||||
6 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 |
. . . . b . . . - - - - - - - - - - - - - A - - - - - - - - - - - - - - -
Trebuie sa determinam ponderile l, formand un sistem de ecuatii A l = b, care
duce la: = unde f este un multiplicator Lagrangian, pentru a se asigura conditia ål = 1.
i | 1 | 2 | 3 | 4 | 5 | 6 | l | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | -,17216 | 0,04964 | 0,02231 | -,02597 | 0,12618 | 0,27262 | 0,03169 | |||||||||||||
2 | 0,04964 | -,16654 | 0,03219 | 0,07747 | 0,00724 | 0,20679 | 0,19973 | |||||||||||||
A-1 = | 3 | 0,02231 | 0,03219 | -,11120 | 0,06621 | -,00950 | 0,35657 | -,02273 | ||||||||||||
4 | -,02597 | 0,07747 | 0,06621 | -,30728 | 0,18957 | 0,03006 | 0,60617 | |||||||||||||
5 | 0,12618 | 0,00724 | -,00950 | 0,18957 | -,31349 | 0,13397 | 0,18514 | |||||||||||||
6 | 0,27262 | 0,20679 | 0,35657 | 0,03006 | 0,13397 | -6,87298 | -,15111 | <= f |
Ca urmare, in punctul necunoscut
z (x = 5, y = 5) = å l z(xi), adica:
z =0,03169 * 3 + 0,19973 * 4 - 0,02273 * 2 + 0,60617 * 4 + 0,18514 * 6 = 4,384
cu o varianta estimata s 2 = å l b + f , respectiv:
s 2 = [0,03169 * 6,987 + 0,19973 * 5,597 - 0,02273 * 8,186 + 0,60617 * 3,622 + 0,18514 * 4.720] - .151
s 2 = 4.222 - .151 = 4.071
Studiul terenului implica lucrul cu probleme ce depind de:
Terenul poate fi aproximat ca un mozaic de parcele (petice). Astfel de parcele trebuie sa fie definnite conceptual inaintea efectuarii oricarei analize spatiale. In cele din urma, definirea (stabilirea, delimitarea) parcelei ar trebui sa se bazeze pe una din urmatoarele consideratii:
Odata ce a fost definita o parcela, analistul SIG poate analiza probleme ca:
Pentru a asista analistul SIG a fost creat de catre ecologisti un set de caracteristici cantitative diferite, metrici ale terenului (landscape metrics). Exemple de caracteristici:
unde:
O examinare definitiva a utilitatii, stabilitatii si interpretarii lor nu a fost inca realizata. Kelley (1996) a examinat comportarea unui set ales de metrici ale terenului, grupate ca generale, cele care se refera la compozitie si cele care se refera la configuratie (vezi tabelul 1), cu diferite marimi ale celulei raster (10, 30, 50, 100 si 200 metri) si rezolutii ale parcelelor (fina comparativ cu grosiera).
Tabelul 1. Metrici alese pentru caracterizarea terenului
Compozitie | Configuratie | Generala |
---|---|---|
Indicele de diversitate al lui Shannon |
Indicele mediu de forma |
Aria totala |
Indicele de diversitate al lui Simpson |
Indicele de forma a terenului |
Numarul de parcele |
Indicele de diversitate modificat al lui Simpson |
Indicele mediu de forma ponderat dupa arie |
Dimensiunea medie a parcelei |
Fertilitatea parcelei |
Dimensiunea dubla a fractalului Log |
Lungimea totala a laturilor |
Indicele de planitate al lui Shannon | Dimensiunea fractalului mediu ponderat cu aria parcelei |
|
Indicele de planitate al lui Simpson | Distanta medie la cel mai apropiat vecin |
|
Indicele de planitate modificat al lui Simpson |
Indicele de contagiune |
|
Indicele celei mai mari parcele |
Indicele de alternare/alaturare |
Metricile de mai sus au fost calculate din straturile suprafetei formate ca fisiere SIG ERDAS si au constituit intrari in programul de calcule statistice FRAGSTATS v2.0
Metrici de compozitie
Toti Indicii de diversitate si planitate ca si cel de fertilitate a parcelei au fost invarianti cu dimensiunile celulelor raster fata de granulatie. Indicele parcelei celei mai mari a fost invariant cu dimensiunile celulelor raster pentru terenuri cu granulatie fina, dar crescut la dimensiunea celulei de 100 metri pentru terenuri cu granulatie mare.
Metrici de configuratie
indicele mediu de forma si indicele formei terenului au crescut cu crestera dimensiunilor celulelor raster fata de granulatie. indicele mediu de forma cu ariile ca ponderi a fost invariant cu dimensiunile celulelor pentru terenuri cu granulatie fina, dar a crescut la dimensiunea celulei de 100 metri pentru terenuri cu granulatie mare. Dimensiunea dubla a fractalului Log a crescut usor cu cresterea dimensiunilor celulelor raster fata de granulatie. Dimensiunea fractalului parcelei medii cu ponderi ariile a fost invarianta cu dimensiunile celulelor raster fata de granulatie. Distanta medie pana la cel mai apropiat -vecin a crescut cu cresterea dimensiunilor celulelor raster fata de granulatie. Indicele de contagiune a scazut usor cu cresterea dimensiunilor celulelor raster fata de granulatie. indicele de alternare/alaturare a fost invariant cu dimensiunile celulelor raster fata de granulatie.
Metrici generale
Aria totala a crescut cu dimensiunile celulelor raster fata de granulatie. Numarul de parcele a scazut cu dimensiunea celulei raster de 200 metri fata de granulatie. Dimensiunea medie a parcelei a fost invarianta cu dimensiunile celulelor raster pentru terenuri cu granulatie fina, dar a crescut la dimensiunea celulei raster de 200 metri pentru terenuri cu granulatie mare. Laturile totale au scazut cu cresterea dimensiunilor celulelor raster fata de granulati.
Concluzii
Nivelul rezolutiei parcelelor si dimensiunea celulei raster au efecte puternice asupra comportarii anumitor metrici ale terenului. Metricile trebuie sa fie evaluate cu atentie pentru relevanta lor in analiza spatiala. Cateva directii pentru conducerea analizei terenului sunt:
Cu punctare si clic pe sageata catre dreapta se trece la capitolul urmator, iar pe sageata catre stânga la capitolul anterior.
This document was last updated September 11, 2001.
Send comments and suggestions to: cnitu@personal.ro