Pravidlo Sturges Vysvetlenie, aplikácie a príklady



Sturges pravidlo je kritérium používané na určenie počtu tried alebo intervalov, ktoré sú potrebné na grafické znázornenie súboru štatistických údajov. Toto pravidlo vyniesol v roku 1926 nemecký matematik Herbert Sturges.

Sturges navrhol jednoduchú metódu, založenú na počte vzoriek x, ktoré umožnili zistiť počet tried a ich rozsahovú amplitúdu. Pravidlo Sturges sa široko používa najmä v oblasti štatistiky, konkrétne na budovanie frekvenčných histogramov.

index

  • 1 Vysvetlenie
  • 2 Aplikácie
  • 3 Príklad
  • 4 Odkazy

vysvetlenie

Pravidlo Sturges je empirická metóda široko používaná v opisných štatistikách na určenie počtu tried, ktoré musia existovať vo frekvenčnom histograme, s cieľom klasifikovať súbor údajov, ktoré predstavujú vzorku alebo populáciu..

Toto pravidlo v podstate určuje šírku grafických kontajnerov, histogramov frekvencie.

Na založenie svojho pravidla považoval Herbert Sturges ideálny frekvenčný diagram, ktorý sa skladá z intervalov K, kde ithový interval obsahuje určitý počet vzoriek (i = 0, ... k - 1) reprezentovaných ako:

Tento počet vzoriek je daný počtom spôsobov, ktorými je možné extrahovať podmnožinu množiny; tj binomickým koeficientom vyjadreným takto: \ t

Na zjednodušenie výrazu použil vlastnosti logaritmov v oboch častiach rovnice:

Sturges teda zistil, že optimálny počet intervalov k je daný výrazom:

Môže byť vyjadrený aj ako:

V tomto výraze:

- k je počet tried.

- N je celkový počet pozorovaní vzorky.

- Log je spoločný logaritmus bázy 10.

Ak chcete napríklad vytvoriť frekvenčný histogram, ktorý vyjadruje náhodnú vzorku výšky 142 detí, počet intervalov alebo tried, ktoré bude mať distribúcia:

k = 1 + 3,322 * záznam10 (N)

k = 1 + 3,322* záznam (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Distribúcia bude teda v 8 intervaloch.

Počet intervalov by mal byť vždy reprezentovaný celými číslami. V prípadoch, keď je hodnota desatinná, musí sa vykonať aproximácia k najbližšiemu celému číslu.

aplikácie

Pravidlo Sturgovcov sa uplatňuje hlavne v štatistikách, pretože umožňuje rozloženie frekvencií prostredníctvom výpočtu počtu tried (k), ako aj dĺžky každej z nich, známej aj ako amplitúda.

Amplitúda je rozdiel medzi horným a dolným limitom triedy, vydelený počtom tried a je vyjadrený: \ t

Existuje mnoho empirických pravidiel, ktoré umožňujú vykonať frekvenčné rozdelenie. Pravidlo Sturges sa však bežne používa, pretože sa približuje počtu tried, ktoré sa všeobecne pohybujú od 5 do 15.

Týmto spôsobom zvážte hodnotu, ktorá primerane predstavuje vzorku alebo populáciu; to znamená, že aproximácia nepredstavuje extrémne zoskupenia, ani nepracuje s nadmerným počtom tried, ktoré neumožňujú zhrnutie vzorky.

príklad

Je potrebné vykonať frekvenčný histogram podľa daných údajov, ktorý zodpovedá veku získanému v prieskume mužov, ktorí vykonávajú cvičenia v miestnej telocvični..

Na určenie intervalov musíte vedieť, aká je veľkosť vzorky alebo počet pozorovaní; v tomto prípade máte 30.

Potom platí pravidlo Sturges:

k = 1 + 3,322 * záznam10 (N)

k = 1 + 3,322* záznam (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 intervalov.

Z počtu intervalov sa môže vypočítať amplitúda, ktorú budú mať; to znamená, že šírka každého stĺpca predstavovaného vo frekvenčnom histograme:

Dolná hranica sa považuje za najnižšiu hodnotu údajov a horná hranica je najvyššia hodnota. Rozdiel medzi hornou a dolnou hranicou sa nazýva rozsah alebo dráha premennej (R)..

Z tabuľky vyplýva, že horná hranica je 46 a dolná hranica 13; týmto spôsobom bude amplitúda každej triedy:

Intervaly budú tvorené hornou a dolnou hranicou. Na určenie týchto intervalov začnite počítať od dolného limitu a pridajte k nemu amplitúdu určenú pravidlom (6) takto:

Potom sa vypočíta absolútna frekvencia na určenie počtu mužov zodpovedajúcich každému intervalu; v tomto prípade je to:

- Interval 1: 13 - 18 = 9

- Interval 2: 19 - 24 = 9

- Interval 3: 25 - 30 = 5

- Interval 4: 31 - 36 = 2

- Interval 5: 37 - 42 = 2

- Interval 6: 43 - 48 = 3

Ak sa pripočítava absolútna frekvencia každej triedy, musí sa rovnať celkovému počtu vzoriek; v tomto prípade 30.

Následne sa vypočíta relatívna frekvencia každého intervalu, vydelením absolútnej frekvencie tohto intervalu celkovým počtom pozorovaní:

- Interval 1: fi = 9 ÷ 30 = 0,30

- Interval 2: fi = 9 ÷ 30 = 0,30

- Interval 3: fi = 5 ° 30 = 0,1666

- Interval 4: fi = 2 ° 30 = 0,0666

- Interval 5: fi = 2 × 30 = 0,0666

- Interval 4: fi = 3 ° 30 = 0,10

Potom môžete vytvoriť tabuľku, ktorá bude odrážať údaje a tiež diagram z relatívnej frekvencie vo vzťahu k získaným intervalom, ako je možné vidieť na nasledujúcich obrázkoch:

Týmto spôsobom pravidlo Sturges umožňuje určiť počet tried alebo intervalov, v ktorých môže byť vzorka rozdelená, aby sa zhrnula vzorka údajov prostredníctvom prípravy tabuliek a grafov..

referencie

  1. Alfonso Urquía, M. V. (2013). Modelovanie a simulácia diskrétnych udalostí. UNED,.
  2. Altman Naomi, M. K. (2015). "Jednoduchá lineárna regresia." Nature Methods .
  3. Antúnez, R. J. (2014). Štatistika vo vzdelávaní. Digitálny UNID.
  4. Fox, J. (1997). Aplikovaná regresná analýza, lineárne modely a súvisiace metódy. SAGE Publikácie.
  5. Humberto Llinás Solano, C. R. (2005). Popisné štatistiky a rozdelenia pravdepodobnosti. Univerzita severu.
  6. Panteleeva, O. V. (2005). Základy pravdepodobnosti a štatistiky.
  7. O. Kuehl, M. O. (2001). Návrh experimentov: Štatistické princípy návrhu a výskumnej analýzy. Redakcia Thomson.