- Privalumai ir trūkumai
- Diapazono kaip dispersijos rodiklio trūkumai
- Tarpkvartilinis diapazonas, kvartiliai ir dirbtinis pavyzdys
- - Kvarilių skaičiavimas
- Pirmasis kvartilas
- Antrasis kvartilis arba mediana
- Trečias kvartilas
- Veiksmingas pavyzdys
- Sprendimas
- B sprendimas
- C sprendimas
- Nuorodos
Asortimentas , diapazonas arba amplitudės, statistika, yra skirtumas (atimtis) tarp didžiausios vertės ir minimalios vertės duomenų rinkinį iš mėginio arba gyventojų. Jei diapazoną vaizduoja R raidė, o duomenis žymi x, diapazono formulė yra paprasčiausia:
R = x max - x min
Kur x max yra didžiausia duomenų vertė, o x min yra mažiausia.
1 pav. Duomenų, atitinkančių Kadiso gyventojų skaičių per pastaruosius du šimtmečius, diapazonas. Šaltinis: „Wikimedia Commons“.
Ši sąvoka yra labai naudinga kaip paprastas dispersijos matas, norint greitai įvertinti duomenų kintamumą, nes ji nurodo intervalo, kuriame jie randami, prailginimą ar ilgį.
Pavyzdžiui, tarkime, kad išmatuojamas 25 universiteto pirmojo kurso inžinerijos studentų grupės aukštis. Aukščiausias grupės mokinys yra 1,93 m, o trumpiausias 1,67 m. Tai yra kraštutinės imties duomenų vertės, todėl jų kelias yra:
R = 1,93 - 1,67 m = 0,26 m arba 26 cm.
Šios grupės mokinių ūgis pasiskirsto pagal šį diapazoną.
Privalumai ir trūkumai
Diapazonas yra, kaip minėjome anksčiau, duomenų pasiskirstymo matas. Mažas diapazonas rodo, kad duomenys yra daugiau ar mažiau artimi, o sklaida yra maža. Kita vertus, didesnis diapazonas rodo, kad duomenys yra labiau išsklaidyti.
Diapazono apskaičiavimo pranašumai yra akivaizdūs: juos labai lengva ir greita rasti, nes tai paprastas skirtumas.
Ji taip pat turi tuos pačius vienetus, kaip ir duomenys, su kuriais ji veikia, ir sąvoką labai lengva aiškinti bet kuriam stebėtojui.
Inžinerijos studentų aukščio pavyzdyje, jei atstumas būtų buvęs 5 cm, pasakytume, kad visi studentai yra maždaug vienodo dydžio. Bet kai diapazonas yra 26 cm, mes iškart manome, kad imtyje yra visų vidutinio ūgio studentų. Ar ši prielaida visada teisinga?
Diapazono kaip dispersijos rodiklio trūkumai
Jei atidžiai pažvelgsime, gali būti, kad iš mūsų 25 inžinerijos studentų pavyzdžių tik vienas iš jų matuoja 1,93, o likusių 24 aukštis yra artimas 1,67 m.
Vis dėlto nuotolis išlieka tas pats, nors visiškai įmanoma priešingai: daugumos aukštis yra maždaug 1,90 m, o tik vieno - 1,67 m.
Bet kuriuo atveju duomenų pasiskirstymas yra gana skirtingas.
Diapazono, kaip dispersijos rodiklio, trūkumai yra todėl, kad jis naudoja tik kraštutines vertes ir nepaiso visų kitų. Kadangi prarandama didžioji dalis informacijos, net neįsivaizduojate, kaip paskirstomi imties duomenys.
Kita svarbi savybė yra tai, kad mėginio diapazonas niekada nemažėja. Jei pridedame daugiau informacijos, tai yra, atsižvelgiame į daugiau duomenų, diapazonas padidėja arba išlieka tas pats.
Bet kokiu atveju tai naudinga tik dirbant su mažais mėginiais, nerekomenduojama jo naudoti vien tik kaip dispersijos matavimą dideliuose mėginiuose.
Tai turi būti papildyta apskaičiuojant kitas dispersijos matas, kuriose atsižvelgiama į bendrą duomenų teikiamą informaciją: tarpkvartilinis diapazonas, dispersija, standartinis nuokrypis ir variacijos koeficientas.
Tarpkvartilinis diapazonas, kvartiliai ir dirbtinis pavyzdys
Mes supratome, kad diapazono silpnumas kaip dispersijos matas yra tas, kad jis naudojasi tik kraštutinėmis duomenų paskirstymo vertėmis, praleisdamas kitas.
Siekiant išvengti šio nepatogumo, naudojami kvartilai: trys vertės, vadinamos padėties matais.
Nesuderintus duomenis jie suskirsto į keturias dalis (kitos plačiai naudojamos padėties matavimo priemonės yra deciliai ir procentiliai). Tai yra jo savybės:
-Pirmasis kvartilis Q 1 yra duomenų vertė, kai 25% visų jų yra mažesni už Q 1 .
-Antrasis kvartilis Q 2 yra pasiskirstymo mediana, o tai reiškia, kad pusė (50%) duomenų yra mažesnė už šią vertę.
- Galiausiai trečiasis kvartilas Q 3 rodo, kad 75% duomenų yra mažesni nei Q 3 .
Tuomet tarpkvartilinis diapazonas arba tarpkvartilinis diapazonas apibrėžiamas kaip skirtumas tarp trečiojo kvartilio Q 3 ir pirmojo kvartilio Q 1 duomenų:
Tarpkvartilinis diapazonas = R Q = Q 3 - Q 1
Tokiu būdu diapazono R Q reikšmei nedaro didelės įtakos kraštutinės vertės. Dėl šios priežasties patartina jį naudoti sprendžiant pasvirusius pasiskirstymus, pavyzdžiui, aukščiau aprašytų aukštų ar labai trumpų mokinių atžvilgiu.
- Kvarilių skaičiavimas
Yra keletas būdų, kaip juos apskaičiuoti, čia mes pasiūlysime vieną, tačiau bet kokiu atveju būtina žinoti eilės numerį "N o ", tai yra vieta, kurią paskirstyme užima atitinkamas kvartilis.
Tai yra, jei, pavyzdžiui, Q 1 atitinkantis terminas yra antrasis, trečiasis ar ketvirtasis ir tt pasiskirstymas.
Pirmasis kvartilas
N arba (Q 1 ) = (N + 1) / 4
Antrasis kvartilis arba mediana
N arba (Q 2 ) = (N + 1) / 2
Trečias kvartilas
N arba (Q 3 ) = 3 (n + 1) / 4
Kur N yra duomenų skaičius.
Mediana yra vertė, esanti paskirstymo viduryje. Jei duomenų skaičius yra nelyginis, jį surasti nėra problemų, tačiau jei jis yra lygus, dviejų centrinių verčių vidurkis tampa viena.
Suskaičiavus užsakymo numerį, laikomasi vienos iš šių trijų taisyklių:
-Jei nėra skaitmenų po kablelio, ieškoma paskirstyme nurodytų duomenų ir tai bus ieškoma kvartilė.
-Kai užsakymo numeris yra pusiaukelėje tarp dviejų, tada sveikosios dalies nurodyti duomenys yra vidurkinami šiais duomenimis, o rezultatas yra atitinkamas kvartilis.
-Jokiu kitu atveju jis suapvalinamas iki artimiausio sveikojo skaičiaus ir tai bus kvartilio padėtis.
Veiksmingas pavyzdys
Tarp 0 ir 20 balų 16-osios matematikos I grupės mokiniai per vidurinį egzaminą pelnė šiuos pažymius (taškus):
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Rasti:
a) duomenų diapazonas arba diapazonas.
b) Kvarcių Q 1 ir Q 3 vertės
c) Tarpkvartalinis diapazonas.
2 paveikslas. Ar šio matematikos testo rezultatai gali labai skirtis? Šaltinis: „Pixabay“.
Sprendimas
Pirmas dalykas, kurį reikia padaryti norint rasti maršrutą, yra duomenų užsakymas didėjančia ar mažėjančia tvarka. Pavyzdžiui, didėjančia tvarka jūs turite:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Naudojant pradžioje pateiktą formulę: R = x max - x min
R = 20 - 1 balas = 19 taškų.
Pagal rezultatą šie įvertinimai yra labai išsisklaidę.
B sprendimas
N = 16
N arba (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Tai yra skaičius su dešimtainiais skaičiais, kurių sveikoji dalis yra 4. Tada einame į paskirstymą, ieškome duomenų, kurie užima ketvirtą vietą, o jo vertė yra vidutinė su penktosios padėties reikšme. Kadangi jie abu yra 9, vidurkis taip pat yra 9 ir taip:
Q 1 = 9
Dabar pakartojame procedūrą, kad rastume 3 klausimą :
N arba (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Vėlgi, ji yra dešimtainė, bet kadangi ji nėra pusiaukelė, ji suapvalinama iki 13. Siekiama kvartilė užima tryliktą poziciją ir yra:
Q 3 = 16
C sprendimas
R Q = Q 3 - Q 1 = 16 - 9 = 7 balai.
Kuris, kaip matome, yra daug mažesnis už a punkte apskaičiuotą duomenų diapazoną, nes mažiausias balas buvo 1 balas, o vertė buvo daug toliau nuo kitų.
Nuorodos
- Berenson, M. 1985. Vadybos ir ekonomikos statistika. „Interamericana SA“
- Canavos, G. 1988. Tikimybė ir statistika: taikymai ir metodai. McGraw Hill.
- Devore, J. 2012. Inžinerijos ir mokslo tikimybės ir statistika. 8-asis. Leidimas. Cengažas.
- Kvarilių pavyzdžiai. Atkurta iš: matematicas10.net.
- Levin, R. 1988. Administratorių statistika. 2-asis. Leidimas. Prentice salė.
- Walpole, R. 2007. Inžinerijos ir mokslų tikimybės ir statistika. Pearsonas.