Viaceré priestory, metóda a použitia lineárnej regresie



viacnásobná lineárna regresia je výpočtový nástroj, ktorý skúma vzťah príčiny a následku predmetov štúdia a testuje komplexné hypotézy.

Používa sa v matematike a štatistike. Tento typ lineárnej regresie vyžaduje závislé premenné (inými slovami, výsledky) a nezávislé premenné (to znamená príčiny), ktoré nasledujú hierarchický poriadok, popri iných faktoroch súvisiacich s rôznymi oblasťami štúdia..

Zvyčajne je lineárna regresia taká, ktorá je reprezentovaná lineárnou funkciou, ktorá sa vypočíta z dvoch závislých premenných. To má ako svoj najdôležitejší prípad ten, v ktorom študovaný fenomén má priamu líniu regresie.

V danej množine údajov (x1, y1) (xn, yn) a hodnôt, ktoré zodpovedajú dvojici náhodných premenných v priamej vzájomnej korelácii, môže regresná čiara začať, na začiatku, formu rovnice, ako y = a · x + b .

Teoretické východiská výpočtu vo viacnásobnej lineárnej regresii

Akýkoľvek výpočet s použitím viacnásobnej lineárnej regresie bude závisieť na študovanom objekte a oblasti štúdia, ako je ekonomika, pretože premenné spôsobujú, že použité vzorce majú zložitosť, ktorá sa líši podľa prípadu..

To znamená, že čím zložitejšia je otázka, tým viac faktorov sa musí brať do úvahy, tým viac údajov sa musí zozbierať, a tým väčší je objem prvkov, ktoré sa majú zahrnúť do výpočtu, čím sa tento vzorec zvýši..

Vo všetkých týchto vzorcoch je však bežné, že existuje vertikálna os (jedna zo súradníc alebo os Y) a horizontálna os (na osi x alebo os X), ktoré sú po vypočítaní znázornené graficky pomocou kartézskeho systému.

Odtiaľ sa robia interpretácie údajov (pozri nasledujúcu časť) a robia sa závery alebo predpovede. V každom prípade sa na zváženie premenných môžu použiť predštatistické priestory, ako napríklad: \ t

1 - Slabá exogenita

Znamená to, že premenná by sa musela predpokladať s pevnou hodnotou, ktorá sa môže len ťažko prispôsobiť zmenám v jej modeli z dôvodu príčin vonkajších okolností.

2- Lineárny charakter

Znamená to, že hodnoty premenných, ako aj iných parametrov a predikčných koeficientov, musia byť zobrazené ako lineárna kombinácia prvkov, ktoré môžu byť v grafe znázornené v karteziánskom systéme..

3- Homocedasticity

To musí byť konštantné. Tu je myslené, že bez ohľadu na prediktívne premenné musí existovať rovnaká odchýlka chýb pre každú rôznu premennú odozvy.

4- Nezávislosť

Vzťahuje sa to len na chyby premenných odozvy, ktoré musia byť zobrazené samostatne a nie ako skupina chýb, ktoré predstavujú definovaný vzor..

5- Absencia multikolinearity

Používa sa pre nezávislé premenné. Stáva sa to vtedy, keď sa pokúšate niečo študovať, ale je k dispozícii len veľmi málo informácií, takže môže byť veľa odpovedí, a preto hodnoty môžu mať mnoho výkladov, ktoré v konečnom dôsledku neriešia problém, ktorý predstavuje.

Existujú aj iné predpoklady, ktoré sa berú do úvahy, ale tie, ktoré sú uvedené vyššie, dávajú jasne najavo, že viacnásobná lineárna regresia vyžaduje veľa informácií nielen na to, aby mali prísnejšie, kompletnejšie a bez predsudkov, ale aby riešenie tejto otázky návrh je konkrétny.

To znamená, že musí ísť do bodu s niečím veľmi špecifickým, špecifickým, ktoré nie je vhodné na to, aby bolo nejasné a že v menšom rozsahu spôsobuje chyby..

Majte na pamäti, že viacnásobná lineárna regresia nie je neomylná a môže byť náchylná na chyby a nepresnosti vo výpočte. Nie je to ani tak kvôli tomu, kto robí štúdiu, ale preto, že konkrétny fenomén prírody nie je úplne predvídateľný alebo nevyhnutne je produktom konkrétnej príčiny.

Často sa stáva, že akýkoľvek objekt sa môže náhle zmeniť alebo že udalosť vzniká z akcie (alebo nečinnosti) mnohých prvkov, ktoré vzájomne pôsobia.

Interpretácia grafiky

Akonáhle boli údaje vypočítané podľa modelov navrhnutých v predchádzajúcich fázach štúdie, vzorce poskytnú hodnoty, ktoré môžu byť reprezentované v grafe..

V tomto poradí myšlienok kartézsky systém ukáže mnoho bodov, ktoré zodpovedajú vypočítaným premenným. Niektoré budú viac v osi osí, zatiaľ čo iné budú viac v osi osí. Niektoré budú viac zoskupené, zatiaľ čo iné budú izolované.

Aby sme si všimli zložitosť pri interpretácii údajov grafov, môžeme pozorovať napríklad Ascombe Quartet. V tomto kvartete sa spracúvajú štyri rôzne súbory údajov a každý z nich je v samostatnom grafe, ktorý si preto zaslúži samostatnú analýzu.

Linearita zostáva, ale body v karteziánskom systéme sa musia pozerať veľmi pozorne predtým, ako sa dozviete, ako sa kusy puzzle stretnú. Potom možno vyvodiť príslušné závery.

Samozrejme, existuje niekoľko spôsobov, ako tieto kusy zapadnúť do seba, hoci podľa rôznych metód, ktoré sú opísané v špecializovaných výpočtových príručkách..

Viacnásobná lineárna regresia, ako už bolo povedané, závisí od mnohých premenných v závislosti od predmetu štúdia a od oblasti, v ktorej sa uplatňuje, takže postupy v ekonómii nie sú rovnaké ako v medicíne alebo v informatike. Vo všetkých, áno, odhad sa robí, hypotéza, ktorá sa potom skontroluje na konci.

Rozšírenia viacnásobnej lineárnej regresie

Existuje niekoľko typov lineárnej regresie, ako je jednoduchá a všeobecná, ale existuje aj niekoľko aspektov viacnásobnej regresie, ktoré sa prispôsobujú rôznym predmetom štúdia, a teda potrebám vedy..

Tieto zvyčajne zvládajú veľký počet premenných, takže často môžete vidieť modely, ako napríklad multivariačné alebo viacúrovňové. Každý používa postuláty a vzorce rôznej zložitosti, takže interpretácia ich výsledkov má tendenciu mať väčší význam..

Metódy odhadu

Existuje široká škála postupov na odhadovanie údajov získaných vo viacnásobnej lineárnej regresii.

Ešte raz, všetko tu bude závisieť od pevnosti použitého modelu, výpočtových vzorcov, počtu premenných, teoretických postulátov, ktoré boli brané do úvahy, oblasti štúdia, algoritmov, ktoré sú naprogramované v špecializovaných počítačových programoch a , par excellence, komplexnosť predmetu, fenoménu alebo udalosti, ktorá sa analyzuje.

Každá metóda odhadu používa úplne odlišné vzorce. Žiadna z nich nie je dokonalá, ale má jedinečné prednosti, ktoré by sa mali používať v súlade so štatistickou štúdiou.

Existujú všetky druhy: inštrumentálne premenné, generalizované najmenšie štvorce, Bayesova lineárna regresia, zmiešané modely, Tyjonovova regularizácia, kvantilná regresia, Theil-Senov odhad a dlhý zoznam nástrojov, s ktorými môžu byť údaje študované s väčšou presnosťou. 

Praktické použitie

Viacnásobná lineárna regresia sa používa v rôznych študijných odboroch av mnohých prípadoch je na získanie presnejších údajov potrebná pomoc počítačových programov..

Týmto spôsobom sa redukujú okraje chýb, ktoré môžu vzniknúť z manuálnych výpočtov (vzhľadom na prítomnosť mnohých nezávislých a závislých premenných, nie je prekvapením, že tento typ lineárnej regresie sa môže dopustiť chýb, pretože existuje mnoho údajov a faktorov spracované).

Pri analýze trhových trendov sa napríklad skúma, či sa zvýšili a znížili akékoľvek údaje, ako napríklad ceny výrobku, ale predovšetkým, kedy a prečo.

Kedy sa analyzuje práve vtedy, keď existujú významné odchýlky v počte v danom časovom období, najmä ak sú zmeny neočakávané. Prečo hľadáte presné alebo pravdepodobné faktory, podľa ktorých tento produkt stúpal, klesal alebo udržiaval svoju maloobchodnú cenu?.

Podobne zdravotné vedy (medicína, bioanalýza, farmácia, epidemiológia, okrem iného) profitujú z mnohonásobnej lineárnej regresie, prostredníctvom ktorej skúmajú zdravotné ukazovatele, ako je úmrtnosť, chorobnosť a pôrodnosť..

V týchto prípadoch môžeme vychádzať zo štúdie, ktorá začína pozorovaním, aj keď potom sa vytvorí model na určenie toho, či zmena niektorých uvedených ukazovateľov je spôsobená určitou konkrétnou príčinou, kedy a prečo.

Financie tiež používajú mnohonásobnú lineárnu regresiu na preskúmanie výhod a nevýhod určitých investícií. Tu je vždy potrebné vedieť, kedy sa uskutočnili finančné transakcie, s kým a aké boli očakávané prínosy.

Úrovne rizika budú vyššie alebo nižšie v súlade s rôznymi faktormi, ktoré sa berú do úvahy pri hodnotení kvality týchto investícií, pri zohľadnení aj objemu menovej výmeny..

Je však v ekonomike, kde je tento nástroj na výpočet najpoužívanejší. Preto sa v tejto vede používa viacnásobná lineárna regresia s cieľom predpovedať výdavky na spotrebu, investičné výdavky, nákupy, vývozy, dovozy, aktíva, dopyt po pracovnej sile, pracovné ponuky a mnohé ďalšie prvky..

Všetky z nich súvisia s makroekonómiou a mikroekonómiou, ktorá je prvou, kde sú premenné analýzy dát hojnejšie, pretože sa nachádzajú globálne..

referencie

  1. Baldor, Aurelio (1967). Rovinná a priestorová geometria s úvodom do trigonometrie. Caracas: Editorial Cultura Venezolana, S.A..
  2. Univerzitná nemocnica Ramón y Cajal (2017). Viacnásobný lineárny regresný model. Madrid, Španielsko: HRC, Madridské spoločenstvo. Zdroj: www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Viacnásobná regresia v behaviorálnom výskume: Vysvetlenie a predikcia, 2. vydanie. New York: Holt, Rinehart & Winston.
  4. Rojo Abuín, J.M. (2007). Viacnásobná lineárna regresia Madrid, Španielsko: Centrum pre ľudské a sociálne vedy. Získané z humanities.cchs.csic.es.
  5. Autonómna madridská univerzita (2008). Viacnásobná lineárna regresia Madrid, Španielsko: UAM. Obnovené z web.uam.es.
  6. Univerzita A Coruña (2017). Viacnásobný lineárny regresný model; Korelácia. La Coruña, Španielsko: UDC, Katedra matematiky. Získané z dm.udc.es.
  7. Uriel, E. (2017). Viacnásobná lineárna regresia: odhad a vlastnosti. Valencia, Španielsko: Univerzita vo Valencii. Obnovené z www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel a Suriñach Caral, Jordi (2002). Viacnásobný lineárny regresný model: špecifikácia, odhad a kontrast. Katalánsko: UOC Editorial.