Pravidlo Sturges Vysvetlenie, aplikácie a príklady
Sturges pravidlo je kritérium používané na určenie počtu tried alebo intervalov, ktoré sú potrebné na grafické znázornenie súboru štatistických údajov. Toto pravidlo vyniesol v roku 1926 nemecký matematik Herbert Sturges.
Sturges navrhol jednoduchú metódu, založenú na počte vzoriek x, ktoré umožnili zistiť počet tried a ich rozsahovú amplitúdu. Pravidlo Sturges sa široko používa najmä v oblasti štatistiky, konkrétne na budovanie frekvenčných histogramov.
index
- 1 Vysvetlenie
- 2 Aplikácie
- 3 Príklad
- 4 Odkazy
vysvetlenie
Pravidlo Sturges je empirická metóda široko používaná v opisných štatistikách na určenie počtu tried, ktoré musia existovať vo frekvenčnom histograme, s cieľom klasifikovať súbor údajov, ktoré predstavujú vzorku alebo populáciu..
Toto pravidlo v podstate určuje šírku grafických kontajnerov, histogramov frekvencie.
Na založenie svojho pravidla považoval Herbert Sturges ideálny frekvenčný diagram, ktorý sa skladá z intervalov K, kde ithový interval obsahuje určitý počet vzoriek (i = 0, ... k - 1) reprezentovaných ako:
Tento počet vzoriek je daný počtom spôsobov, ktorými je možné extrahovať podmnožinu množiny; tj binomickým koeficientom vyjadreným takto: \ t
Na zjednodušenie výrazu použil vlastnosti logaritmov v oboch častiach rovnice:
Sturges teda zistil, že optimálny počet intervalov k je daný výrazom:
Môže byť vyjadrený aj ako:
V tomto výraze:
- k je počet tried.
- N je celkový počet pozorovaní vzorky.
- Log je spoločný logaritmus bázy 10.
Ak chcete napríklad vytvoriť frekvenčný histogram, ktorý vyjadruje náhodnú vzorku výšky 142 detí, počet intervalov alebo tried, ktoré bude mať distribúcia:
k = 1 + 3,322 * záznam10 (N)
k = 1 + 3,322* záznam (142)
k = 1 + 3,322* 2,1523
k = 8,14 ≈ 8
Distribúcia bude teda v 8 intervaloch.
Počet intervalov by mal byť vždy reprezentovaný celými číslami. V prípadoch, keď je hodnota desatinná, musí sa vykonať aproximácia k najbližšiemu celému číslu.
aplikácie
Pravidlo Sturgovcov sa uplatňuje hlavne v štatistikách, pretože umožňuje rozloženie frekvencií prostredníctvom výpočtu počtu tried (k), ako aj dĺžky každej z nich, známej aj ako amplitúda.
Amplitúda je rozdiel medzi horným a dolným limitom triedy, vydelený počtom tried a je vyjadrený: \ t
Existuje mnoho empirických pravidiel, ktoré umožňujú vykonať frekvenčné rozdelenie. Pravidlo Sturges sa však bežne používa, pretože sa približuje počtu tried, ktoré sa všeobecne pohybujú od 5 do 15.
Týmto spôsobom zvážte hodnotu, ktorá primerane predstavuje vzorku alebo populáciu; to znamená, že aproximácia nepredstavuje extrémne zoskupenia, ani nepracuje s nadmerným počtom tried, ktoré neumožňujú zhrnutie vzorky.
príklad
Je potrebné vykonať frekvenčný histogram podľa daných údajov, ktorý zodpovedá veku získanému v prieskume mužov, ktorí vykonávajú cvičenia v miestnej telocvični..
Na určenie intervalov musíte vedieť, aká je veľkosť vzorky alebo počet pozorovaní; v tomto prípade máte 30.
Potom platí pravidlo Sturges:
k = 1 + 3,322 * záznam10 (N)
k = 1 + 3,322* záznam (30)
k = 1 + 3,322* 1,4771
k = 5,90 ≈ 6 intervalov.
Z počtu intervalov sa môže vypočítať amplitúda, ktorú budú mať; to znamená, že šírka každého stĺpca predstavovaného vo frekvenčnom histograme:
Dolná hranica sa považuje za najnižšiu hodnotu údajov a horná hranica je najvyššia hodnota. Rozdiel medzi hornou a dolnou hranicou sa nazýva rozsah alebo dráha premennej (R)..
Z tabuľky vyplýva, že horná hranica je 46 a dolná hranica 13; týmto spôsobom bude amplitúda každej triedy:
Intervaly budú tvorené hornou a dolnou hranicou. Na určenie týchto intervalov začnite počítať od dolného limitu a pridajte k nemu amplitúdu určenú pravidlom (6) takto:
Potom sa vypočíta absolútna frekvencia na určenie počtu mužov zodpovedajúcich každému intervalu; v tomto prípade je to:
- Interval 1: 13 - 18 = 9
- Interval 2: 19 - 24 = 9
- Interval 3: 25 - 30 = 5
- Interval 4: 31 - 36 = 2
- Interval 5: 37 - 42 = 2
- Interval 6: 43 - 48 = 3
Ak sa pripočítava absolútna frekvencia každej triedy, musí sa rovnať celkovému počtu vzoriek; v tomto prípade 30.
Následne sa vypočíta relatívna frekvencia každého intervalu, vydelením absolútnej frekvencie tohto intervalu celkovým počtom pozorovaní:
- Interval 1: fi = 9 ÷ 30 = 0,30
- Interval 2: fi = 9 ÷ 30 = 0,30
- Interval 3: fi = 5 ° 30 = 0,1666
- Interval 4: fi = 2 ° 30 = 0,0666
- Interval 5: fi = 2 × 30 = 0,0666
- Interval 4: fi = 3 ° 30 = 0,10
Potom môžete vytvoriť tabuľku, ktorá bude odrážať údaje a tiež diagram z relatívnej frekvencie vo vzťahu k získaným intervalom, ako je možné vidieť na nasledujúcich obrázkoch:
Týmto spôsobom pravidlo Sturges umožňuje určiť počet tried alebo intervalov, v ktorých môže byť vzorka rozdelená, aby sa zhrnula vzorka údajov prostredníctvom prípravy tabuliek a grafov..
referencie
- Alfonso Urquía, M. V. (2013). Modelovanie a simulácia diskrétnych udalostí. UNED,.
- Altman Naomi, M. K. (2015). "Jednoduchá lineárna regresia." Nature Methods .
- Antúnez, R. J. (2014). Štatistika vo vzdelávaní. Digitálny UNID.
- Fox, J. (1997). Aplikovaná regresná analýza, lineárne modely a súvisiace metódy. SAGE Publikácie.
- Humberto Llinás Solano, C. R. (2005). Popisné štatistiky a rozdelenia pravdepodobnosti. Univerzita severu.
- Panteleeva, O. V. (2005). Základy pravdepodobnosti a štatistiky.
- O. Kuehl, M. O. (2001). Návrh experimentov: Štatistické princípy návrhu a výskumnej analýzy. Redakcia Thomson.