- Dažnio pasiskirstymas
- Kiek klasių reikia atsižvelgti?
- Kaip jis gaunamas?
- Pavyzdys
- Kam tai?
- Pavyzdys
- Nuorodos
Klasės ženklą , taip pat žinomas kaip viduryje, yra į klasę centras, kuris atstovauja visas vertybes, kurios yra toje kategorijoje vertė. Iš esmės klasės ženklas naudojamas apskaičiuoti tam tikrus parametrus, tokius kaip aritmetinis vidurkis arba standartinis nuokrypis.
Taigi klasės ženklas yra bet kokio intervalo vidurys. Ši reikšmė taip pat labai naudinga norint rasti duomenų, jau sugrupuotų į klases, dispersiją, o tai savo ruožtu leidžia mums suprasti, kaip toli nuo centro yra šie specifiniai duomenys.
Dažnio pasiskirstymas
Norint suprasti, kas yra klasės ženklas, būtina paskirstyti dažnį. Atsižvelgiant į duomenų rinkinį, dažnio pasiskirstymas yra lentelė, padalijanti duomenis į keletą kategorijų, vadinamų klasėmis.
Ši lentelė rodo kiekvienai klasei priklausančių elementų skaičių; pastarasis yra žinomas kaip dažnis.
Šioje lentelėje dalis informacijos, kurią gauname iš duomenų, yra paaukota, nes užuot turėję individualią kiekvieno elemento vertę, mes tik žinome, kad jis priklauso tai klasei.
Kita vertus, mes geriau suprantame duomenų rinkinį, nes tokiu būdu lengviau įvertinti nusistovėjusius modelius, o tai palengvina manipuliavimą minėtais duomenimis.
Kiek klasių reikia atsižvelgti?
Norėdami atlikti dažnių paskirstymą, pirmiausia turime nustatyti norimų klasių skaičių ir pasirinkti jų klasių ribas.
Pasirinkti, kiek klasių reikia, turėtų būti patogu, atsižvelgiant į tai, kad nedidelis klasių skaičius gali paslėpti informaciją apie duomenis, kuriuos norime išstudijuoti, o labai didelis - sugeneruoti per daug detalių, kurios nebūtinai yra naudingos.
Veiksniai, į kuriuos turime atsižvelgti renkantis keletą klasių, tačiau iš šių dviejų išsiskiria: pirmas yra atsižvelgti į tai, kiek duomenų turime atsižvelgti; antra, reikia žinoti, koks yra pasiskirstymo diapazonas (tai yra skirtumas tarp didžiausio ir mažiausio stebėjimo).
Turėdami jau apibrėžtas klases, skaičiuojame, kiek duomenų yra kiekvienoje klasėje. Šis skaičius vadinamas klasių dažniu ir žymimas fi.
Kaip jau minėjome anksčiau, dažnio pasiskirstymas praranda informaciją, kuri gaunama atskirai iš kiekvieno duomenų ar stebėjimo. Dėl šios priežasties ieškoma vertės, kuri atspindėtų visą klasę, kuriai ji priklauso; ši vertė yra klasės ženklas.
Kaip jis gaunamas?
Klasės ženklas yra pagrindinė vertė, kurią klasė atstovauja. Jis gaunamas pridedant intervalo ribas ir padalijant šią vertę iš dviejų. Tai galime išreikšti matematiškai taip:
x i = (apatinė riba + viršutinė riba) / 2.
Šia išraiška x i žymi i-osios klasės ženklą.
Pavyzdys
Pateikdami šį duomenų rinkinį, nurodykite tipinį dažnio pasiskirstymą ir gaukite atitinkamą klasės ženklą.
Kadangi duomenys, kurių didžiausia skaitinė vertė yra 391, o mažiausi - 221, turime intervalą 391 –221 = 170.
Mes pasirinksime 5 klases, kurių visos yra vienodo dydžio. Vienas būdas pasirinkti užsiėmimus yra toks:
Atminkite, kad visi duomenys yra klasėje, jie yra nesusiję ir turi tą pačią vertę. Kitas būdas pasirinkti klases yra tai, kad duomenys laikomi tęstinio kintamojo dalimi, kuri gali pasiekti bet kokią tikrąją vertę. Šiuo atveju galime atsižvelgti į formos klases:
205–245, 245–285, 285–325, 325–365, 365–405
Tačiau toks duomenų grupavimo būdas gali parodyti tam tikras ribų neaiškumus. Pavyzdžiui, 245 atveju kyla klausimas: kuriai klasei ji priklauso, pirmajai ar antrajai?
Kad būtų išvengta šios painiavos, sudaromos pasekmės. Tokiu būdu pirmoji klasė bus intervalas (205,245], antroji (245,285] ir pan.).
Apibrėžę klases, skaičiuojame dažnį ir turime šią lentelę:
Gavę duomenų pasiskirstymą dažniu, ieškome kiekvieno intervalo klasių žymių. Iš tikrųjų mes turime:
x 1 = (205 + 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
Tai galime pavaizduoti pagal šią schemą:
Kam tai?
Kaip minėta anksčiau, klasės ženklas yra labai funkcionalus norint rasti aritmetinį vidurkį ir duomenų grupės, jau suskirstytos į skirtingas klases, dispersiją.
Aritmetinį vidurkį galime apibrėžti kaip stebėjimų, gautų tarp imties dydžio, sumą. Fiziniu požiūriu jo aiškinimas yra tarsi duomenų rinkinio pusiausvyros taškas.
Identifikuoti visą duomenų rinkinį vienu numeriu gali būti rizikinga, todėl taip pat reikia atsižvelgti į skirtumą tarp šio lūžio taško ir tikrųjų duomenų. Šios vertės yra žinomos kaip nuokrypis nuo aritmetinio vidurkio, ir jomis mes siekiame nustatyti, kiek skiriasi duomenų aritmetinis vidurkis.
Dažniausias būdas surasti šią vertę yra dispersija, kuri yra nuokrypių nuo aritmetinio vidurkio kvadratų vidurkis.
Norėdami apskaičiuoti klasėje sugrupuoto duomenų rinkinio aritmetinį vidurkį ir dispersiją, mes naudojame atitinkamai šias formules:
Šiose išraiškose x i yra i-oji klasės žymė, f i žymi atitinkamą dažnį ir k klasių, kuriose duomenys buvo sugrupuoti, skaičių.
Pavyzdys
Pasinaudodami ankstesniame pavyzdyje pateiktais duomenimis, turime galimybę šiek tiek daugiau išplėsti dažnio paskirstymo lentelės duomenis. Jūs gaunate:
Tuomet, pakeičiant duomenis formulėje, mums pateikiamas aritmetinis vidurkis:
Jo dispersija ir standartinis nuokrypis yra:
Iš to galime daryti išvadą, kad pirminių duomenų aritmetinis vidurkis yra 306,6, o standartinis nuokrypis - 39,56.
Nuorodos
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Aprašomoji statistika. Esicų redakcija.
- Jhonsonas Richardas A. Milleris ir Freundo tikimybė bei valstybininkai inžinieriams.
- Milleris I ir Freundas J. Tikimybės ir valstybininkai inžinieriams. GRĮŽTI.
- Sarabija A. Jose Maria, Pascual Marta. Pagrindinis statistikos kursas įmonėms
- Llinás S. Humberto, Rojas A. Carlos Aprašomoji statistika ir tikimybių pasiskirstymai, Universidad del Norte Redakcija