- Sugrupuoti duomenys
- Pavyzdys
- 3 pagrindiniai centrinės tendencijos matai
- 1- Aritmetinis vidurkis
- 2 - vidutinis
- 3 - mada
- Nuorodos
Į centrinės tendencijos sugrupuotų duomenų priemonės yra naudojami statistikos apibūdinti tam tikrus įpročius iš pateiktais duomenimis, pavyzdžiui, tai, ką vertiname jie yra arti, kas yra vidutinis surinktų, duomenų tarp kitų grupės.
Paimant didelį duomenų kiekį, naudinga juos sugrupuoti, kad būtų geresnė jų tvarka ir tokiu būdu būtų galima apskaičiuoti tam tikrus centrinės tendencijos matus.
Tarp plačiausiai naudojamų centrinės tendencijos matų yra aritmetinis vidurkis, mediana ir būdas. Šie skaičiai nurodo tam tikras tam tikro eksperimento metu surinktų duomenų savybes.
Norėdami naudoti šias priemones, pirmiausia turite žinoti, kaip sugrupuoti duomenų rinkinį.
Sugrupuoti duomenys
Norėdami sugrupuoti duomenis, pirmiausia turite apskaičiuoti duomenų diapazoną, kuris gaunamas atimant didžiausią vertę atėmus mažiausią duomenų vertę.
Tada pasirenkamas skaičius „k“, tai yra klasių, kuriose norime sugrupuoti duomenis, skaičius.
Diapazonas padalijamas iš „k“, norint gauti klasifikuojamų klasių amplitudę. Šis skaičius yra C = R / k.
Galiausiai prasideda grupavimas, kuriam pasirenkamas skaičius, mažesnis už gautų duomenų mažiausią vertę.
Šis skaičius bus apatinė pirmosios klasės riba. Prie to pridedama C. Gauta vertė bus viršutinė pirmosios klasės riba.
Tada prie šios vertės pridedamas C ir gaunama viršutinė antros klasės riba. Tokiu būdu mes gauname viršutinę paskutinės klasės ribą.
Susumavus duomenis, galima apskaičiuoti vidurkį, mediana ir režimą.
Norėdami parodyti, kaip apskaičiuojamas aritmetinis vidurkis, mediana ir režimas, pateiksime pavyzdį.
Pavyzdys
Todėl, grupuojant duomenis, bus gauta tokia lentelė:
3 pagrindiniai centrinės tendencijos matai
Dabar mes skaičiuosime aritmetinį vidurkį, mediana ir režimą. Aukščiau pateiktas pavyzdys bus naudojamas iliustruoti šią procedūrą.
1- Aritmetinis vidurkis
Aritmetinį vidurkį sudaro kiekvieno dažnio padauginimas iš intervalo vidurkio. Tada visi šie rezultatai pridedami, o galiausiai jis padalinamas iš visų duomenų.
Naudojant ankstesnį pavyzdį, galima gauti, kad aritmetinis vidurkis yra lygus:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Tai rodo, kad lentelės duomenų vidutinė vertė yra 5,11111.
2 - vidutinis
Norėdami apskaičiuoti duomenų rinkinio mediana, pirmiausia sutvarkome visus duomenis nuo mažiausio iki didžiausio. Gali būti du atvejai:
- Jei duomenų skaičius yra nelyginis, tada mediana yra centre esantys duomenys.
- Jei duomenų skaičius yra lygus, tada mediana yra dviejų duomenų, esančių centre, vidurkis.
Kai kalbama apie sugrupuotus duomenis, mediana apskaičiuojama taip:
- apskaičiuojamas N / 2, kur N yra visi duomenys.
- Ieškomas pirmas intervalas, kai sukauptas dažnis (dažnių suma) yra didesnė už N / 2, ir pasirenkama apatinė šio intervalo riba, vadinama Li.
Mediana apskaičiuojama pagal šią formulę:
Me = Li + (Ls-Li) * (N / 2 - sukauptas dažnis prieš Li) / [Li, Ls] dažnis
Ls yra aukščiau paminėto intervalo riba.
Jei naudojama ankstesnė duomenų lentelė, N / 2 = 18/2 = 9. Sukaupti dažniai yra 4, 8, 14 ir 18 (po vieną kiekvienai lentelės eilutei).
Todėl reikia pasirinkti trečiąjį intervalą, nes bendras dažnis yra didesnis nei N / 2 = 9.
Taigi Li = 5 ir Ls = 7. Taikydami aukščiau aprašytą formulę, turite:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3 - mada
Režimas yra reikšmė, kuri turi aukščiausią dažnį tarp visų sugrupuotų duomenų; tai yra, vertė yra daugiausiai kartų kartojama pradiniame duomenų rinkinyje.
Kai turite labai daug duomenų, sugrupuotų duomenų režimui apskaičiuoti naudojama ši formulė:
Mo = Li + (Ls-Li) * (Li dažnis - L (i-1) dažnis) / ((Li dažnis - L (i-1) dažnis) + ((Li dažnis - L dažnis ( i + 1)))
Intervalas [Li, Ls) - tai intervalas, kuriame randamas didžiausias dažnis. Šiame straipsnyje pateiktam pavyzdžiui režimas pateiktas taip:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Kita formulė, naudojama norint gauti apytikslę režimo vertę, yra ši:
Mo = Li + (Ls-Li) * (dažnis L (i + 1)) / (dažnis L (i-1) + dažnis L (i + 1)).
Taikant šią formulę, sąskaitos yra tokios:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Nuorodos
- „Bellhouse“, DR (2011). Abraomas De Moivre'as: Klasikinės tikimybės etapo nustatymas ir jo pritaikymas. „CRC Press“.
- Cifuentes, JF (2002). Įvadas į tikimybių teoriją. Kolumbijos nacionalinis universitetas.
- Daston, L. (1995). Klasikinė tikimybė švietime. Prinstono universiteto leidykla.
- Larsonas, HJ (1978). Įvadas į tikimybių teoriją ir statistinius išvadas. Redakcija „Limusa“.
- Martelis, PJ, ir Vegasas, FJ (1996). Tikimybė ir matematinė statistika: pritaikymai klinikinėje praktikoje ir sveikatos valdyme. „Díaz de Santos“ leidimai.
- Vázquez, AL ir Ortiz, FJ (2005). Statistiniai kintamumo matavimo, apibūdinimo ir kontrolės metodai. Kantabrijos universiteto redaktorius.
- Vázquezas, SG (2009). Matematikos vadovas, skirtas patekti į universitetą. „Centro de Estudios Ramon Areces SA“ redakcija.