- Mann-Whitney U testo problemos aprašymas
- Kokybiniai kintamieji palyginti su kiekybiniais kintamaisiais
- Įprastas atvejis
- Atvejis su normalia tendencija
- Suporuoti arba nesuporuoti mėginiai
- Manno Whitney U testo charakteristikos
- Mannas - Whitney formulė
- Testo taikymo veiksmai
- Praktinio taikymo pavyzdys
- - 1 žingsnis
- - 2 žingsnis
- A regionas
- B regionas
- 3 žingsnis
- 4 žingsnis
- Palyginimo kriterijai
- Internetiniai „Mann - Whitney U“ testo skaičiuotuvai
- Nuorodos
MANN - Whitney U testas yra taikomas už dviejų nepriklausomų pavyzdžių, kai jie turi mažai duomenų arba nesilaiko normalų pasiskirstymą palyginimui. Tokiu būdu jis laikomas neparametriniu testu, skirtingai nuo jo homologinio Studento t testo, kuris naudojamas, kai mėginys yra pakankamai didelis ir atitinka normalųjį pasiskirstymą.
Frankas Wilcoxonas pirmą kartą pasiūlė jį 1945 m. Nustatyti vienodo dydžio mėginius, tačiau po dvejų metų jis buvo pratęstas Henrio Manno ir DR Whitney įvairaus dydžio mėginių pavyzdžių atveju.
1 pav. Mann-Whitney U testas atliekamas palyginant nepriklausomus mėginius. Šaltinis: „Pixabay“.
Testas dažnai atliekamas norint patikrinti, ar yra ryšys tarp kokybinio ir kiekybinio kintamojo.
Iliustracinis pavyzdys yra paimti hipertenzija sergančių žmonių rinkinį ir išskirti dvi grupes, iš kurių vieno mėnesio duomenys užrašomi dienos kraujospūdžiu.
Vienai grupei taikomas gydymas A, kitai - gydymas B. Čia kraujospūdis yra kiekybinis kintamasis, o gydymo tipas - kokybinis.
Norime sužinoti, ar išmatuotų verčių mediana, o ne vidurkis yra statistiškai ta pati ar skirtinga, kad išsiaiškintume, ar skiriasi abu gydymo būdai. Norint gauti atsakymą, taikoma Wilcoxon statistika arba Mann-Whitney U testas.
Mann-Whitney U testo problemos aprašymas
Kitas pavyzdys, kuriame galima pritaikyti testą:
Tarkime, kad norite sužinoti, ar gaiviųjų gėrimų vartojimas labai skiriasi dviejuose šalies regionuose.
Vienas iš jų yra vadinamas A regionu, kitas - B. regionu. Įrašai apie savaitėje suvartotus litrus registruojami dviejuose pavyzdžiuose: vienas iš 10 žmonių - A regionui, o kitas - 5 žmonės - B regionui.
Duomenys yra šie:
-A sritis : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
- B regionas : 12,14, 11, 30, 10
Kyla toks klausimas:
Kokybiniai kintamieji palyginti su kiekybiniais kintamaisiais
-Kokybinis kintamasis X : regionas
- Kokybinis kintamasis Y : gaiviųjų gėrimų vartojimas
Jei litrų kiekis abiejuose regionuose yra vienodas, daroma išvada, kad tarp šių dviejų kintamųjų nėra priklausomybės. Būdas sužinoti yra palyginti abiejų regionų vidutinę ar vidutinę tendenciją.
Įprastas atvejis
Jei duomenys pasiskirsto normaliai, siūlomos dvi hipotezės: nulinis H0 ir alternatyvus H1 palyginus vidurkius:
- H0 : nėra skirtumo tarp dviejų regionų vidurkio.
- H1 : abiejų regionų priemonės skiriasi.
Atvejis su normalia tendencija
Priešingai, jei duomenys nesutampa su normaliu pasiskirstymu arba imtis yra tiesiog per maža, kad jį žinotų, užuot palyginus vidurkį, būtų palyginta dviejų regionų mediana.
- H0 : nėra skirtumo tarp dviejų regionų vidurkio.
- H1 : abiejų regionų mediana skiriasi.
Jei mediana sutampa, tada įvykdoma nulinė hipotezė: tarp gaiviųjų gėrimų vartojimo ir regiono nėra jokio ryšio.
Ir jei atsitinka priešingai, teisinga alternatyvi hipotezė: tarp vartojimo ir regiono yra ryšys.
Būtent šiais atvejais nurodomas Mann - Whitney U testas.
Suporuoti arba nesuporuoti mėginiai
Kitas svarbus klausimas nusprendžiant, ar taikyti Mann Whitney U testą, yra tai, ar abiejų mėginių duomenų skaičius yra vienodas, ty jie yra lygiaverčiai.
Jei du pavyzdžiai yra suporuoti, bus taikoma originali „Wilcoxon“ versija. Bet jei ne, kaip yra pavyzdyje, tada taikomas modifikuotas Wilcoxon testas, kuris yra būtent Manno Whitney U testas.
Manno Whitney U testo charakteristikos
„Mann - Whitney U“ testas yra neparametrinis, taikomas pavyzdžiams, kurie neatitinka normalaus pasiskirstymo arba turi mažai duomenų. Jis turi šias savybes:
1.- Palyginkite medianas
2.– Tai veikia užsakytuose diapazonuose
3.- Ji yra mažiau galinga, ty galia reiškia tikimybę atmesti niekinę hipotezę, kai ji iš tikrųjų yra klaidinga.
Atsižvelgiant į šias charakteristikas, Mann - Whitney U testas atliekamas, kai:
- Duomenys yra nepriklausomi
-Jie nesilaiko normalaus pasiskirstymo
- Nulinė hipotezė H0 priimama, jei dviejų mėginių mediana sutampa: Ma = Mb
- Alternatyvi hipotezė H1 priimama, jei skiriasi dviejų mėginių mediana: Ma ≠ Mb
Mannas - Whitney formulė
Kintamasis U yra kontrasto statistika, naudojama atliekant Manno ir Vitnio testą. Jis apibūdinamas taip:
Tai reiškia, kad U yra mažiausia reikšmė tarp Ua ir Ub, taikoma kiekvienai grupei. Mūsų pavyzdyje tai būtų kiekvienam regionui: A arba B.
Kintamieji Ua ir Ub yra apibrėžti ir apskaičiuojami pagal šią formulę:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Na ir Nb reikšmės yra mėginių dydžiai, atitinkamai atitinkantys A ir B sritis, o jų atžvilgiu Ra ir Rb yra rangų sumos, kurias apibūdinsime toliau.
Testo taikymo veiksmai
1.- Užsakykite dviejų pavyzdžių vertes.
2.- Kiekvienai vertei priskirkite užsakymo rangą.
3.- Ištaisykite esamus duomenų ryšius (pakartotos vertės).
4.- Apskaičiuokite Ra = A mėginio gretų sumą.
5. Raskite Rb = B pavyzdžio gretų sumą.
6.- Pagal ankstesniame skyriuje pateiktas formules nustatykite reikšmes Ua ir Ub.
7.- Palyginkite Ua ir Ub, o mažesnioji iš dviejų yra priskiriama eksperimentinei U statistikai (tai yra, duomenims), kuri yra palyginama su teorine arba normalia U statistika.
Praktinio taikymo pavyzdys
Dabar taikome aukščiau paminėtą gaiviųjų gėrimų problemą:
A regionas: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
B regionas: 12,14, 11, 30, 10
Priklausomai nuo to, ar abiejų mėginių vidurkiai statistiškai yra vienodi ar skirtingi, nulinė hipotezė yra priimama arba atmesta: tarp kintamųjų Y ir X nėra jokio ryšio, tai yra, gaiviųjų gėrimų vartojimas nepriklauso nuo regiono:
H0: Ma = Mb
H1: Ma ≠ Mb
2 pav. Nealkoholinių gėrimų vartojimo duomenys A ir B regionuose. Šaltinis: F. Zapata.
- 1 žingsnis
Duomenis užsakome kartu su dviem pavyzdžiais, pateikdami reikšmes nuo žemiausios iki didžiausios:
Atminkite, kad 11 vertė rodoma 2 kartus (po vieną kiekviename pavyzdyje). Iš pradžių jis turi 3 ir 4 pozicijas arba diapazonus, tačiau norint nenuvertinti ar neįvertinti nei vienos, nei kitos, vidutinė reikšmė pasirenkama kaip intervalas, tai yra 3,5.
Panašiu būdu mes einame su 12 reikšme, kuri pakartojama tris kartus su 5, 6 ir 7 intervalais.
Na, 12 reikšmei priskiriamas vidutinis intervalas 6 = (5 + 6 + 7) / 3. Tas pats 14 vertei, kurios raištis (pasirodo abiejuose pavyzdžiuose) 8 ir 9 padėtyse, jai priskiriamas vidutinis intervalas 8,5 = (8 + 9) / 2.
- 2 žingsnis
Tada A ir B regiono duomenys vėl bus atskirti, bet dabar jų atitinkami intervalai priskiriami kitoje eilutėje:
A regionas
B regionas
Ra ir Rb intervalai gaunami iš antros eilės elementų sumų kiekvienam atvejui ar regionui.
3 žingsnis
Skaičiuojamos atitinkamos Ua ir Ub vertės:
Ū = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Eksperimento vertė U = min (19, 31) = 19
4 žingsnis
Daroma prielaida, kad teorinis U seka normalųjį N pasiskirstymą, kurio parametrai pateikiami atsižvelgiant tik į mėginių dydį:
N ((na⋅nb) / 2, √)
Norint palyginti eksperimentiškai gautą kintamąjį U, su teoriniu U reikia pakeisti kintamąjį. Pereiname nuo eksperimentinio kintamojo U prie jo standartizuotos vertės, kuri bus vadinama Z, kad galėtume palyginti su standartizuoto normaliojo paskirstymo dydžiu.
Kintamasis keičiamas taip:
Z = (U - na.nb / 2) / √
Pažymėtina, kad keičiant kintamąjį buvo naudojami U teorinio pasiskirstymo parametrai, tada naujasis kintamasis Z, kuris yra hibridinis tarp teorinės U ir eksperimentinės U, priešinamas standartizuotam normaliajam pasiskirstymui N (0,1). ).
Palyginimo kriterijai
Jei Z ≤ Zα ⇒, priimama niekinė H0 hipotezė
Jei Z> Zα ⇒ atmeskite niekinę H0 hipotezę
Standartizuotos Zα kritinės vertės priklauso nuo reikalaujamo patikimumo lygio, pavyzdžiui, kai patikimumo lygis α = 0,95 = 95%, o tai yra dažniausiai įprasta, gaunama kritinė vertė Zα = 1,96.
Čia pateiktiems duomenims:
Z = (U - na nb / 2) / √ = -0,73
Kuri yra žemiau kritinės vertės 1,96.
Taigi galutinė išvada yra tokia, kad nepriimtina hipotezė H0:
Internetiniai „Mann - Whitney U“ testo skaičiuotuvai
Yra specialios statistinių skaičiavimų programos, įskaitant SPSS ir MINITAB, tačiau šios programos yra mokamos ir jomis naudotis ne visada lengva. Taip yra todėl, kad jie teikia tiek daug galimybių, kad praktiškai juos naudoja tik statistikos ekspertai.
Laimei, yra daugybė labai tikslių, nemokamų ir lengvai naudojamų internetinių programų, leidžiančių paleisti „Mann-Whitney U“ testą, be kita ko.
Šios programos yra:
-Social Science Statistics (socscistatistics.com), kuris turi ir Mann-Whitney U testą, ir Wilcoxon testą, jei mėginiai yra subalansuoti arba suporuoti.
-AI terapijos statistika (ai-therapy.com), kurioje yra keli įprasti aprašomosios statistikos testai.
-Statistiška naudoti (fizika.csbsju.edu/stats), viena iš seniausių, todėl jos sąsaja gali atrodyti pasenusi, nors vis dėlto tai yra labai efektyvi nemokama programa.
Nuorodos
- Dietrichsonas. Kiekybiniai metodai: rango testas. Atkurta iš: bookdown.org
- Marín J P. SPSS vadovas: Neparametrinių testų analizė ir procedūros. Atkurta iš: halweb.uc3m.es
- USAL MOOC. Neparametriniai testai: Mann-Whitney U. Atkurta iš: youtube.com
- Vikipedija. Mann-Whitney U testas. Atkurta iš: es.wikipedia.com
- XLSTAT. Pagalbos centras. „Mann“ - „Whitney“ testo pamoka „Excel“. Atkurta iš: help.xlsat.com