- Laisvės laipsnių tipai
- Mechaniniu atveju
- Atsitiktinių verčių rinkinyje
- Pavyzdžiai
- Variacija ir laisvės laipsniai
- Chi kvadrato paskirstyme
- Atliekant hipotezės testą (pateikus išspręstą pavyzdį)
- Nuorodos
Į laisvės laipsnių statistikoje yra nepriklausomų komponentų atsitiktinių vektorių skaičius. Jei vektorius turi n komponentus ir yra p linijinių lygčių, susijusių su jo komponentais, tada laisvės laipsnis yra np.
Laisvės laipsnių sąvoka atsiranda ir teorinėje mechanikoje, kur maždaug jie yra lygiaverčiai erdvės, kurioje dalelė juda, matmeniui atėmus jungčių skaičių.
1 pav. Švytuoklė juda dviem matmenimis, tačiau ji turi tik vieną laisvės laipsnį, nes yra priversta judėti L spindulio lanku. Šaltinis: F. Zapata.
Šiame straipsnyje bus aptarta statistikoje taikoma laisvės laipsnių samprata, tačiau mechaninį pavyzdį lengviau įsivaizduoti geometrine forma.
Laisvės laipsnių tipai
Priklausomai nuo konteksto, kuriame jis taikomas, laisvės laipsnių skaičiaus apskaičiavimo būdas gali skirtis, tačiau pagrindinė idėja visada yra ta pati: bendri matmenys atėmus apribojimų skaičių.
Mechaniniu atveju
Panagrinėkime svyruojančią dalelę, susietą su styga (švytuokle), kuri juda vertikalioje xy plokštumoje (2 matmenys). Tačiau dalelė priversta judėti spindulio, lygaus stygos ilgiui, perimetru.
Kadangi dalelė gali judėti tik ta kreive, laisvės laipsnių skaičius yra 1. Tai galima pamatyti 1 paveiksle.
Laisvės laipsnių skaičiaus apskaičiavimo būdas yra matmenų skaičiaus skirtumas atėmus apribojimų skaičių:
laisvės laipsniai: = 2 (matmenys) - 1 (ligatūra) = 1
Kitas paaiškinimas, leidžiantis mums pasiekti rezultatą, yra toks:
-Mes žinome, kad dviejų dimensijų padėtis pavaizduota koordinačių tašku (x, y).
-Bet kadangi taškas turi atitikti apskritimo (x 2 + y 2 = L 2 ) lygtį, atsižvelgiant į nurodytą kintamojo x vertę, kintamąjį y nustato ši lygtis arba apribojimas.
Tokiu būdu tik vienas iš kintamųjų yra nepriklausomas ir sistema turi vieną (1) laisvės laipsnį.
Atsitiktinių verčių rinkinyje
Tarkime, kad vektorius parodytų, ką reiškia sąvoka
x = (x 1 , x 2 ,…, x n )
Atstovauja n paprastai pasiskirstančių atsitiktinių verčių imtį. Šiuo atveju atsitiktinis vektorius x turi n nepriklausomų komponentų, todėl sakoma, kad x turi n laisvės laipsnį.
Dabar sukonstruokime liekanų vektorių r
r = (x 1 -
Kur
Taigi suma
(x 1 -
Tai lygtis, vaizduojanti apribojimą (arba surišimą) liekanų vektoriaus r elementuose , nes jei yra žinomi n-1 vektoriaus r komponentai, apribojimo lygtis nustato nežinomą komponentą.
Todėl n matmens vektorius r su apribojimu:
∑ (x i -
Jis turi (n - 1) laisvės laipsnius.
Vėl taikoma, kad laisvės laipsnių skaičiavimas yra toks:
laisvės laipsniai: = n (matmenys) - 1 (apribojimai) = n-1
Pavyzdžiai
Variacija ir laisvės laipsniai
Variacija s 2 yra apibrėžiama kaip n duomenų imties nuokrypių (arba liekanų) kvadrato vidurkis:
s 2 = ( r • r ) / (n-1)
kur r yra liekanų vektorius r = (x1 -
s 2 = ∑ (x i -
Bet kokiu atveju reikia pažymėti, kad apskaičiuojant liekanų kvadrato vidurkį, jis yra padalintas iš (n-1), o ne su n, nes, kaip aptarta ankstesniame skyriuje, vektoriaus r laisvės laipsnių skaičius yra ( n-1).
Jei apskaičiuojant dispersiją, ji būtų padalyta iš n, o ne (n-1), rezultatas turėtų paklaidą, kuris yra labai reikšmingas, kai n vertės yra mažesnės nei 50.
Literatūroje dispersijos formulė taip pat atsiranda su dalikliu n, o ne (n-1), kai kalbama apie populiacijos dispersiją.
Bet liekanų atsitiktinio kintamojo aibė, vaizduojama vektoriaus r , nors ir turi dimensiją n, turi tik (n-1) laisvės laipsnius. Tačiau jei duomenų skaičius yra pakankamai didelis (n> 500), abi formulės suartina tą patį rezultatą.
Skaičiuotuvuose ir skaičiuoklėse pateikiamos tiek dispersijos versijos, tiek standartinis nuokrypis (tai yra dispersijos kvadratinė šaknis).
Atsižvelgiant į čia pateiktą analizę, mūsų rekomendacija yra visada pasirinkti versiją su (n-1) kiekvieną kartą, kai reikia apskaičiuoti dispersiją ar standartinį nuokrypį, kad būtų išvengta šališkų rezultatų.
Chi kvadrato paskirstyme
Kai kurie tikimybės pasiskirstymai ištisiniame atsitiktiniame kintamajame priklauso nuo parametro, vadinamo laisvės laipsniu, tai yra Chi kvadrato skirstinys (χ 2 ).
Šio parametro pavadinimas kilęs būtent iš atsitiktinio vektoriaus, kuriam taikomas šis skirstinys, laisvės laipsnių.
Tarkime, kad turime g populiacijas, iš kurių imami n dydžio mėginiai:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
…
X j = (xj 1 , xj 2 ,… ..xj n )
…
Xg = (xg 1 , xg 2 ,… ..xg n )
J populiacija reiškia
Standartizuotas arba normalizuotas kintamasis zj i apibrėžiamas taip:
zj i = (xj i -
O vektorius Zj apibūdinamas taip:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) ir seka standartizuotą normalųjį pasiskirstymą N (0,1).
Taigi kintamasis:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
seka χ 2 (g) pasiskirstymas, vadinamas chi-kvadrato pasiskirstymu su laisvės laipsniu g.
Atliekant hipotezės testą (pateikus išspręstą pavyzdį)
Kai norite patikrinti hipotezes, pagrįstas tam tikru atsitiktinių duomenų rinkiniu, turite žinoti laisvės laipsnių skaičių g, kad galėtumėte pritaikyti Chi-kvadrato testą.
2 pav. Ar yra ryšys tarp ledų skonio aromatas ir kliento LYTIS? Šaltinis: F. Zapata.
Pavyzdžiui, bus analizuojami duomenys, surinkti apie vyrų ir moterų šokolado ar braškių ledų pasirinkimus tam tikrame ledų salone. Vyrai ir moterys, pasirinkdami braškes ar šokoladą, yra apibendrinti 2 paveiksle.
Pirmiausia apskaičiuojama numatomų dažnių lentelė, kuri parengiama padauginus visas eiles iš stulpelių sumos, padalytos iš visų duomenų. Rezultatas parodytas šiame paveikslėlyje:
3 paveikslas. Tikėtinų dažnių apskaičiavimas pagal stebėtus dažnius (2 pav. Mėlynos spalvos vertės). Šaltinis: F. Zapata.
Tada Chi kvadratas apskaičiuojamas (remiantis duomenimis) pagal šią formulę:
χ 2 = ∑ (F o - F e ) 2 / F e
Čia F o yra stebimi dažniai (2 paveikslas), o F e yra tikėtini dažniai (3 paveikslas). Susumavimas eina per visas eilutes ir stulpelius, kurie mūsų pavyzdyje pateikia keturias sąvokas.
Atlikę operacijas gausite:
χ 2 = 0,2043.
Dabar reikia palyginti su teorine Chi kvadratu, kuris priklauso nuo laisvės laipsnių skaičiaus g.
Mūsų atveju šis skaičius nustatomas taip:
g = (# eilutės - 1) (# stulpeliai - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Pasirodo, kad laisvumo laipsnių skaičius g šiame pavyzdyje yra 1.
Jei norite patikrinti ar paneigti nulinę hipotezę (H0: tarp TASTE ir GENDER nėra koreliacijos), kurios reikšmingumo lygis yra 1%, teorinė Chi-kvadrato vertė apskaičiuojama laisvės laipsniu g = 1.
Ieškoma vertė, pagal kurią sukauptas dažnis (1 - 0,01) = 0,99, tai yra, 99%. Ši vertė (kurią galima gauti iš lentelių) yra 6 636.
Kadangi teorinis Chi viršija apskaičiuotąją, tada patikrinama nulinė hipotezė.
Kitaip tariant, su surinktais duomenimis nepastebimas ryšys tarp kintamųjų TASTE ir LYTIS.
Nuorodos
- Minitabas. Kokie yra laisvės laipsniai? Atkurta iš: support.minitab.com.
- Moore, Davidas. (2009 m.) Pagrindinė taikoma statistika. Antoni Bosch redaktorius.
- Leigh, Jennifer. Kaip apskaičiuoti laisvės laipsnius statistiniuose modeliuose. Atgauta iš: geniolandia.com
- Vikipedija. Laisvės laipsnis (statistika). Atkurta iš: es.wikipedia.com
- Vikipedija. Fizinio laisvės laipsnis. Atkurta iš: es.wikipedia.com