Hur påverkas standardavvikelsen av extremvärden
Standardavvikelse
I detta förra avsnittet tittade oss tillsammans hjälp från variationsbredd samt kvartiler vid observationsvärdenas spridning runt medianen, dock man förmå även existera intresserad från mått för hur något sprids vad gäller spridning runt medelvärdet. detta vanligaste måttet vid spridning runt medelvärdet existerar standardavvikelse, vilket oss bör bekanta oss tillsammans inom detta avsnitt.
Definition från standardavvikelse
Med standardavvikelsen menar oss en mått vid den genomsnittliga avvikelsen ifrån medelvärdet inom enstaka serie observationsvärden. Ju större standardavvikelsen existerar, desto större existerar spridningen bland våra observationsvärden.
När oss bör beräkna standardavvikelsen börjar oss tillsammans för att beräkna medelvärdet på grund av observationsvärdena (vilket oss denna plats betecknar tillsammans m) samt sedan kalkylerar oss hur många varenda enskilt observationsvärde (här betecknat tillsammans med x) avviker ifrån detta medelvärde.
Avvikelsen ifrån medelvärde på grund av en observationsvärde kunna oss därför nedteckna som
$$x-m$$
där x existerar observationsvärdet samt m existerar medelvärdet till serien.
I nästa steg kvadrerar oss fanns samt ett från dessa avvikelser ifrån medelvärdet, vilket får mot resultat dels för att varenda våra kvadrerade avvikelser blir positiva, dels för att stora avvikelser inom kvadrerad struktur blir ännu större inom jämförelse tillsammans med små kvadrerade avvikelser.
Den kvadrerade avvikelsen på grund av en observationsvärde blir därför
$$(x-m)^2$$
När oss äger dessa kvadrerade avvikelser till vart samt en från våra observationsvärden önskar oss ju äga reda vid hur massiv den genomsnittliga kvadrerade avvikelsen existerar. Därför summerar oss samtliga kvadrerade avvikelser samt dividerar denna summa tillsammans antalet observationsvärden, vilket ger oss följande:
$$\frac{\sum {(x-m)^2}}n$$
där n existerar antalet observationer.
Nu existerar oss nästan klara, dock detta värde oss får från formeln ovan besitter ej identisk avdelning såsom observationsvärdena. på grund av för att rätta mot detta kalkylerar oss roten ur vår genomsnittliga kvadrerade avvikelse.
Sammanfattningsvis får oss därför nästa formel till standardavvikelsen:
$$\sigma = \sqrt{\frac{\sum {(x-m)^2}}{n}}$$
där ∑ existerar summan från detta såsom följer mot motsats till vänster, x existerar en enskilt observationsvärde, m existerar medelvärdet, samt n existerar antalet observationer.
Standardavvikelse
Låt oss för tillfället titta vid numeriskt värde konkreta modell vid kalkyl från standardavvikelse tillsammans hjälp från fallen tillsammans åldersspridningen nära våra båda middagar, liksom oss existerar bekanta tillsammans ifrån dem tidigare statistikavsnitten.
Vid släktmiddagen besitter oss deltagare tillsammans nästa åldrar (observationsvärden) samt medelvärde, \(m_s\):
$$1,\, 4,\, 3,\, 15,\, 72,\, 41,\, 30,\, 27,\, 72,\, 8,\, 42,\, 36,\, 33,\, 46,\, 44$$
$$medelvärde\, (m_s) = 31,6\,år$$
Vid kompismiddagen äger oss deltagare tillsammans nästa åldrar (observationsvärden) samt medelvärde, \(m_k\):
$$30,\, 31,\, 33,\, 34,\, 35,\, 34,\, 28,\, 34,\, 33,\, 34,\, 36,\, 35,\, 32,\, 31,\, 32$$
$$medelvärde\, (m_k)=32,8\,år$$
Nu är kapabel oss räkna ut avvikelsen ifrån medelvärdet till vart samt en från dessa observationsvärden.
I tabellen nedan besitter oss räknat ut avvikelsen på grund av såväl släktmiddagen likt kompismiddagen:
| Släktmiddag | \(m_{s}\)=31,6 | Kompismiddag | \(m_{k}\)=32,8 |
| \(x_{s}\) | \((x_{s}-m_{s})\) | \(x_{k}\) | \((x_{k}-m_{k})\) |
| 1 | -30,6 | 28 | -4,8 |
| 3 | -28,6 | 30 | -2,8 |
| 4 | -27,6 | 31 | -1,8 |
| 8 | -23,6 | 31 | -1,8 |
| 15 | -16,6 | 32 | -0,8 |
| 27 | -4,6 | 32 | -0,8 |
| 30 | -1,6 | 33 | 0,2 |
| 33 | 1,4 | 33 | 0,2 |
| 36 | 4,4 | 34 | 1,2 |
| 41 | 9,4 | 34 | 1,2 |
| 42 | 10,4 | 34 | 1,2 |
| 44 | 12,4 | 34 | 1,2 |
| 46 | 14,4 | 35 | 2,2 |
| 72 | 40,4 | 35 | 2,2 |
| 72 | 40,4 | 36 | 3,2 |
När oss idag besitter beräknat avvikelsen ifrån medelvärdet på grund av vart samt en från observationsvärdena, bör oss kvadrera dessa avvikelser. Dessa kvadrerade avvikelser kalkylerar oss samt redovisar inom nästa tabell:
| Släktmiddag | \(m_{s}\)=31,6 | Kompismiddag | \(m_{k}\)=32,8 |
| \(x_{s}\) | \((x_{s}-m_{s})^2\) | \(x_{k}\) | \((x_{k}-m_{k})^2\) |
| 1 | 936,36 | 28 | 23,04 |
| 3 | 817,96 | 30 | 7,84 |
| 4 | 761,76 | 31 | 3,24 |
| 8 | 556,69 | 31 | 3,24 |
| 15 | 275,56 | 32 | 0,64 |
| 27 | 21,16 | 32 | 0,64 |
| 30 | 2,56 | 33 | 0,04 |
| 33 | 1,96 | 33 | 0,04 |
| 36 | 19,36 | 34 | 1,44 |
| 41 | 88,36 | 34 | 1,44 |
| 42 | 108,16 | 34 | 1,44 |
| 44 | 153,76 | 34 | 1,44 |
| 46 | 207,36 | 35 | 4,84 |
| 72 | 1632,16 | 35 | 4,84 |
| 72 | 1632,16 | 36 | 10,24 |
Nu summerar oss dem kvadrerade avvikelserna till dem båda serierna samt kalkylerar standardavvikelsen på grund av dem båda middagssällskapen.
För släktmiddagen får vi
$$\sigma_s=\sqrt{\frac{\sum {(x_s-m_s)^2}}{n}}=\sqrt{\frac{7215,6}{15}}\approx21,9$$
och på grund av kompismiddagen
$$\sigma_k=\sqrt{\frac{\sum {(x_k-m_k)^2}}{n}}=\sqrt{\frac{64,4}{15}}\approx2,1$$
Som oss ser äger oss såsom väntat enstaka betydligt större spridning inom fallet tillsammans släktmiddagen (21,9 år) än nära kompismiddagen (2,1 år) även då oss idag tittar vid spridningen ifrån medelvärdet.
Standardavvikelse nära stickprovsundersökningar
I våra exempelfall på denna plats ovanför besitter oss räknat vid standardavvikelsen inom läka populationen (åldern vid samtliga deltagare nära respektive kvällsmål fanns känd), dock utför man ett större statistisk studie tittar man oftast bara vid en stickprov från populationen man undersöker. Standardavvikelsen till en stickprov får oss genom formeln
$$s = \sqrt{\frac{\sum (x-m)^{2}}{n-1}}$$
Skillnaden mot den vanliga formeln till standardavvikelsen består inom för att man inom detta denna plats fallet dividerar tillsammans (n - 1) istället till n. Anledningen mot för att man använder detta värde existerar för att man genom stickprovsundersökningar inom praktiken äger märkt för att detta ger enstaka förbättrad uppskattning från den faktiska standardavvikelsen inom bota populationen angående man fullfölja så.
Ett vanligt användningsområde till standardavvikelsen existerar nära normalfördelning, vilken oss kommer för att bekanta oss tillsammans med inom nästa avsnitt.