Hur räknar man ut statistik utstickare
Korrelation samt regressionsanalys
I detta denna plats avsnittet bör oss titta närmare vid dem båda besläktade begreppen korrelation samt regressionsanalys. tillsammans hjälp från dessa term kunna oss hitta samband inom serier från observationsvärden, liksom oss inom sin tur kunna nyttja till för att erhålla enstaka förbättrad medvetande på grund av dem fenomen liksom oss undersöker inom olika sammanhang.
Korrelation
Vi bestämmer oss till för att utföra enstaka granskning var oss den inledande måndagen inom varenda kalendermånad beneath en helt års period beräknar antalet personer vid enstaka tågperrong mellan klockan 9 samt 10. då året existerar slut därför sammanställer oss resultaten inom ett tabell i enlighet med nedan.
I en spridningsdiagram låter man den en variabeln, kallad den förklarande variabeln, finnas längs x-axeln, samt den andra variabeln, responsvariabeln, finnas längs y-axeln. inom vårt modell existerar vilken kalendermånad detta existerar den förklarande variabeln samt antalet räknade personer vid perrongen responsvariabeln. på grund av varenda tillgängligt värde vid den förklarande variabeln markerar oss in dess motsvarande värde till responsvariabeln (i vårt fall existerar mot modell en från värdena vid den förklarande variabeln "mars" samt motsvarande värde vid responsvariabeln 105 personer). Utifrån denna serie observationsvärden kunna oss sedan undersöka ifall detta finns något samband mellan vilken tidsperiod detta existerar samt antalet personer liksom befunnit sig vid perrongen. Detta fullfölja oss inledningsvis genom för att rita in våra observationsvärden inom en spridningsdiagram.
Markerar oss vid detta sätt varenda par från värden vid den förklarande variabeln samt responsvariabeln inom en spridningsdiagram, sålunda ser detta inom vårt modell ut vid nästa sätt:
Utifrån en spridningsdiagram är kapabel man sedan ett fåtal ett perception angående om detta finns något samband, alternativt korrelation, mellan den förklarande variabeln samt responsvariabeln.
Om observationsvärdena liksom man besitter markerat inom spridningsdiagrammet ligger samlade runt enstaka tänkt linje tillsammans med positiv lutning, således säger man för att detta finns enstaka positiv korrelation mellan den förklarande variabeln samt responsvariabeln. Detta existerar fallet på grund av följd såsom markerats inom diagrammet nedan.
Om dem observationsvärden såsom man markerat däremot ligger samlade runt ett tänkt linje tillsammans enstaka negativ lutning, sålunda kallar man detta ett negativ korrelation mellan den förklarande variabeln samt responsvariabeln, vilket oss ser en modell vid inom diagramet nedan.
I en fall likt vårt modell inom start från avsnittet, var detta varken verkar finnas enstaka positiv alternativt negativ korrelation mellan variablerna, säger man för att korrelation saknas samt oss kunna då dra slutsatsen för att detta utifrån våra observationsvärden ej tycks finnas något samband mellan vilken kalendermånad detta existerar samt hur flera personer likt befinner sig vid perrongen.
Något liksom existerar viktigt för att anlända minnas då oss fullfölja korrelationsundersökningar, existerar för att bara på grund av för att detta finns ett korrelation mellan dem variabler oss tittar vid, således behöver detta ej finnas en orsakssamband. tillsammans med detta menar oss för att även angående detta finns ett korrelation mellan variablerna, sålunda förmå detta finnas någon ytterligare variabel såsom ej finns tillsammans med inom vår utvärdering, liksom redogör varför våra variabler samvarierar.
Om oss mot modell fullfölja ett granskning var oss jämför ålder tillsammans förekomst från enstaka viss sjukdom, sålunda är kapabel detta artikel således för att detta finns ett kraftfull positiv korrelation mellan hur äldre enstaka individ existerar samt hur vanligt förekommande sjukdomen existerar. Dock är kapabel oss ej utan vidare dra slutsatsen för att detta existerar upphöjd ålder liksom orsakat sjukdomen, då detta kunna finnas andra faktorer likt agerar in, mot modell levnadsvanor, förekomst från andra sjukdomar, kostvanor tidigare inom existensen, etc. Därför bör man existera försiktig tillsammans med för att dra slutsatser angående för att man funnit en orsakssamband, då man egentligen bara förmå äga funnit ett korrelation mellan dem studerade variablerna.
Regressionsanalys
Vi är kapabel utifrån en spridningsdiagram var oss ser en linjärt samband (antingen positiv alternativt negativ korrelation) förklara sambandet tillsammans enstaka linjär modell alternativt tillsammans andra mening förklara sambandet tillsammans hjälp från räta linjens ekvation vid formen
$$f(x) = kx + m$$
När oss söker efter enstaka linjär modell liksom beskriver sambandet mellan våra variabler, kallar man detta linjär regression alternativt regressionsanalys. vilket oss söker existerar alltså ett linje liksom våra markerade punkter avviker sålunda lite ifrån likt möjligt. besitter oss en spridningsdiagram sålunda förmå oss till grabb rita in ett sådan ungefärlig linje samt sedan ta reda vid linjens k-värde samt m-värde, vid identisk sätt såsom oss gjort tidigare utifrån kända punkter. Den räta linjens ekvation såsom oss försöker för att anlända fram mot kallas den maximalt anpassade ekvationen samt existerar den linje var avvikelsen ifrån dem markerade punkterna/mätvärdena inom diagrammet existerar därför små liksom möjligt.
För för att erhålla fram enstaka därför precist linjär anpassning likt möjligt, använder man sig mot modell från sådana inbyggda funktioner på grund av för att utföra linjär regression likt finns vid flera grafritande miniräknare.
När man genom regressionsanalys väl äger funnit enstaka ekvation likt således gott detta går beskriver detta statistiska underlag liksom man äger, förmå man sedan nyttja denna raka modell mot för att förutse vad man kommer för att ett fåtal på grund av värden nära andra mätpunkter.
Medellängden vid svenska barn
I spridningsdiagrammet nedan äger oss markerat in medellängden (responsvariabel; längs y-axeln) vid svenska små människor inom åldrarna 1-16 kalenderår (den förklarande variabeln; längs x-axeln).
Som oss kunna titta sålunda verkar detta finnas ett positiv linjär korrelation mellan åldern samt den genomsnittliga längden. Därför förmå oss försöka för att hitta enstaka linjär modell till sambandet tillsammans hjälp från enstaka linjär regressionsanalys.
Vi börjar tillsammans för att dra ett rät linje likt ligger vid en sådant sätt för att avvikelsen mellan sträcka samt punkterna blir således små vilket möjligt.
När oss idag besitter enstaka rät linje markerad inom vårt spridningsdiagram, förmå oss, vilket till vilken ytterligare rät linje likt helst, studera från koordinaterna på grund av numeriskt värde slumpmässiga punkter längs sträcka. Dessa punkter behöver ej existera någon från dem punkter vilket oss markerat inom diagrammet; punkterna längs linje liksom oss läser från får även gärna ligga ner ett utmärkt bit ifrån varandra längs linje, därför för att eventuella avläsningsfel blir mindre betydelsefulla.
I spridningsdiagrammet ovan äger oss markerat dem båda punkterna (4; 102,5) samt (15; 172).
När oss väl äger funnit koordinaterna till numeriskt värde punkter längs sträcka, använder oss dessa till för att beräkna lutningen vid vår linje:
$$k=\frac{172-102,5}{15-4}=\frac{69,5}{11}\approx6,3$$
I nästa steg kalkylerar oss räta linjens ekvation inom dess totalitet, tillsammans hjälp från antingen k-formen alternativt enpunktsformen.
Vi använder oss på denna plats från k-formen, sätter in dem kända koordinaterna på grund av enstaka från punkterna längs linje samt får ut konstanttermen m:
$$f(x)=kx+m$$
$$172=\frac{69,5}{11}\cdot 15+m$$
$$m=172-\frac{69,5\cdot 15}{11}\approx77$$
När oss idag känner mot värdet vid såväl riktningskoefficienten k liksom konstanttermen m, äger oss vår sökta räta linjes ekvation:
$$f(x)=6,3x+77$$
Detta existerar alltså detta raka samband vilket oss besitter funnit mellan ålder, x, samt genomsnittlig längd, y, utifrån vårt statistiska material.
Som oss skrev tidigare sålunda kunna man nyttja enstaka linjär regression till för att förutse framtida värden, detta önskar yttra inom vårt modell vilken längd unge inom allmänhet kommer för att äga nära olika åldrar. oss är kapabel utifrån detta raka sambandet förutse ungefär hur utdragen ett 13-åring är:
$$f(13)=6,3\cdot 13+77=158,9\,cm$$
En linjär regression, angående analysen äger utförts riktig, stämmer väl inom detta intervall oss undersökt samt ofta även enstaka bit utanför detta, dock ju längre försvunnen ifrån detta intervall oss fått den raka regressionen ifrån, desto sämre fungerar ofta modellen. Skulle oss nyttja vår raka modell ovan på grund av för att ta reda vid hur utdragen ett 50-åring existerar, således får oss detta till
$$f(50)=6,3\cdot 50+77=392\,cm$$
En 50-åring från normallängd skulle i enlighet med den denna plats modellen alltså artikel ca 3,92 meter utdragen, vilket visar vid för att modellen ej existerar tillämpbar vid vuxna människor (eftersom människor normalt slutar för att växa vid längden inom 18-20årsåldern).
Det existerar även troligt för att vår raka modell existerar dålig vid för att förutse riktigt unga barns längd, mot modell då barnet existerar nyfött, detta önskar yttra 0 kalenderår gammalt (vilket oss även förmå ana oss mot ifall oss tittar inom spridningsdiagrammet till åldern 1 år). i enlighet med vår modell bör en 0 kalenderår gammalt ungar äga ett längd vid 77 cm, dock inom själva verket existerar genomsnittslängden till nyfödda ungar ca 50 cm.
Vi avslutar tillsammans med för att visa inom en modell hur oss kunna låta GeoGebra producera enstaka linjär modell ovan sambandet åt oss.
Ett konditori sålde semlor beneath åtta veckor mellan januari samt mars samt förde statistik ovan hur priset vid semlor påverkade försäljningen. Tabellen nedan visar resultatet.
| Priset per semla (kr) | Antal avyttrade semlor |
| 36 | 1009 |
| 64 | 440 |
| 72 | 383 |
| 45 | 660 |
| 54 | 635 |
| 42 | 732 |
| 39 | 875 |
| 60 | 618 |
Anpassa enstaka rät linje mot mätpunkterna, ange linjens ekvation samt vilken sorts korrelation sambandet visar.
Lösning:
Vi börjar tillsammans med för att öppna GeoGebra, oss kommer denna gång nyttja Geogebra classic samt öppna en kalkylblad samt föra in värdena inom tabellen således här.
Sedan markerar oss varenda våra värden samt klickar vid stapeldiagrammet längst bort upp samt väljer Tvåvariabels regressionsanalys vilket oss förmå titta inom bilden nedan.
Då får oss upp en spridningsdiagram vilket ser ut likt följande:
För för att producera vår raka modell, sålunda väljer oss Linjär inom rullgardinsmenyn
Då skapas vår linje inom spridningsdiagrammet direkt samt längs ner kunna oss studera från linjens ekvation.
Så svaret blir alltså för att linjens ekvation mot vår raka modell existerar ungefär (avrundat mot heltal) \(f(x) = -15x + 1436\) samt oss är kapabel titta för att sambandet motsvarar enstaka negativ korrelation.
Sammanfattning
Korrelation beskriver samband, både inom styrka samt riktning
Regressionsanalys existerar för att oss försöker beskriva sambandet tillsammans ett linjär modell tillsammans med hjälp från räta linjens ekvation vid formen \(f(x) = kx + m \)