Centrálne trendy pre zoskupené dáta



opatrenia centrálnej tendencie zoskupených údajov používajú sa v štatistikách na opis určitých správ skupiny poskytnutých údajov, ako napríklad to, čo sa približuje, aký je priemer získaných údajov, okrem iného.

Keď sa prijíma veľké množstvo údajov, je užitočné zoskupiť ich tak, aby mali lepšie poradie a mohli tak vypočítať určité miery centrálnej tendencie.

Medzi opatreniami centrálnej tendencie najpoužívanejšími sú aritmetický priemer, medián a režim. Tieto čísla udávajú určité kvality údajov zhromaždených v určitom experimente.

Na použitie týchto opatrení je potrebné najprv vedieť, ako zoskupiť súbor údajov.

Zoskupené údaje

Na zoskupenie údajov musíte najprv vypočítať rozsah údajov, ktorý sa získa odčítaním najvyššej hodnoty mínus najnižšia hodnota údajov..

Potom zvoľte číslo "k", čo je počet tried, do ktorých chcete údaje zoskupiť.

Rozdelíme rozsah medzi „k“, aby sme získali amplitúdu tried, ktoré majú byť zoskupené. Toto číslo je C = R / k.

Nakoniec sa začne zoskupovanie, pre ktoré sa vyberie menšie číslo, než je najmenšia hodnota získaných údajov..

Toto číslo bude dolnou hranicou prvej triedy. K tomu sa pridá C. Získaná hodnota bude horná hranica prvej triedy.

Potom sa k tejto hodnote pridá C a získa sa horná hranica druhej triedy. Týmto spôsobom budete postupovať dovtedy, kým nedosiahnete hornú hranicu poslednej triedy.

Po zoskupení údajov môžete vypočítať priemer, medián a mód.

Na ilustráciu, ako sa vypočíta aritmetický priemer, medián a režim, budeme pokračovať príkladom.

príklad

Preto pri zoskupovaní údajov získate tabuľku, ako je táto:

Tri hlavné opatrenia centrálnej tendencie

Teraz pristúpime k výpočtu aritmetického priemeru, mediánu a režimu. Vyššie uvedený príklad sa použije na ilustráciu tohto postupu.

1 - Aritmetický priemer

Aritmetický priemer pozostáva z vynásobenia každej frekvencie priemerom intervalu. Potom sa pridajú všetky tieto výsledky a nakoniec sa vydelia celkovými údajmi.

Použitím predchádzajúceho príkladu získame, že aritmetický priemer sa rovná:

(4 * 2 + 4 * 4 + 6 * 6 + 4 x 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

To znamená, že priemerná hodnota údajov v tabuľke je 5.11111.

2- Médium

Na výpočet mediánu dátového súboru sa najskôr všetky údaje usporiadajú od najmenej po najväčšie. Môžu byť predložené dva prípady:

- Ak je údajové číslo nepárne, potom mediánom sú údaje, ktoré sa nachádzajú priamo v strede.

- Ak je údajové číslo párne, potom je stredný priemer dvoch údajov, ktoré zostali v strede.

Pokiaľ ide o zoskupené údaje, výpočet mediánu sa vykoná nasledujúcim spôsobom:

- N / 2 sa vypočíta, kde N je celkový údaj.

- Prvý interval sa vyhľadáva tam, kde je nahromadená frekvencia (súčet frekvencií) väčšia ako N / 2 a vyberie sa dolná hranica tohto intervalu, nazývaná Li..

Medián je daný týmto vzorcom: \ t

Me = Li + (Ls-Li) * (N / 2 - Akumulovaná frekvencia pred Li) / Frekvencia [Li, Ls]

Ls je horná hranica vyššie uvedeného rozsahu.

Ak sa použije vyššie uvedená tabuľka údajov, máme N / 2 = 18/2 = 9. Akumulované frekvencie sú 4, 8, 14 a 18 (jeden pre každý riadok tabuľky).

Preto by mal byť zvolený tretí interval, pretože nahromadená frekvencia je väčšia ako N / 2 = 9.

Takže Li = 5 a Ls = 7. Ak použijete vyššie uvedený vzorec, musíte:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3 - Móda

Móda je hodnota, ktorá má najviac frekvencií medzi všetkými zoskupenými údajmi; to znamená, že je to hodnota, ktorá sa opakuje najviac v počiatočnom súbore údajov.

Ak máte veľmi veľké množstvo údajov, na výpočet režimu zoskupených údajov sa používa nasledujúci vzorec:

Mo = Li + (Ls-Li) * (frekvencia Li - frekvencia L (i-1)) / ((Li-frekvencia frekvencie L (i-1)) + (frekvencia Li-frekvencie L i + 1)))

Interval [Li, Ls] je interval, v ktorom sa nachádza najvyššia frekvencia. Pre príklad uvedený v tomto článku máme, že mód je daný:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4) = 5 + 2 * 2/4 = 5 + 1 = 6.

Ďalší vzorec, ktorý sa používa na získanie približnej hodnoty módy, je nasledujúci:

Mo = Li + (Ls-Li) * (frekvencia L (i + 1)) / (frekvencia L (i-1) + frekvencia L (i + 1)).

S týmto vzorcom sú účty nasledovné:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

referencie

  1. Bellhouse, D. R. (2011). Abraham De Moivre: Nastavenie etapy pre klasickú pravdepodobnosť a jej aplikácie. CRC Stlačte.
  2. Cifuentes, J. F. (2002). Úvod do teórie pravdepodobnosti. Národný Kolumbia.
  3. Daston, L. (1995). Klasická pravdepodobnosť v osvietenstve. Princeton University Press.
  4. Larson, H. J. (1978). Úvod do teórie pravdepodobnosti a štatistickej dedukcie. Editorial Limusa.
  5. Martel, P. J., & Vegas, F. J. (1996). Pravdepodobnosť a matematická štatistika: aplikácie v klinickej praxi a manažment zdravia. Ediciones Díaz de Santos.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). Štatistické metódy na meranie, opis a kontrolu variability. Ed. University of Cantabria.
  7. Vázquez, S. G. (2009). Matematický manuál pre prístup na univerzitu. Redakčné centrum štúdií Ramon Areces SA.