Standardafvigelse vs gennemsnit
I beskrivende og inferentielle statistikker bruges flere indekser til at beskrive et datasæt svarende til dets centrale tendens, spredning og skævhed. I statistisk inferens er disse almindeligvis kendt som estimatorer, da de estimerer populationsparameterværdierne.
Central tendens henviser til og lokaliserer centrum for fordelingen af værdier. Gennemsnit, tilstand og median er de mest almindeligt anvendte indekser til at beskrive den centrale tendens i et datasæt. Spredning er mængden af spredning af data fra centrum af distributionen. Område og standardafvigelse er de mest almindeligt anvendte mål for spredning. Pearsons skævhedskoefficienter bruges til at beskrive skævheden af en fordeling af data. Her henviser skævhed til, om datasættet er symmetrisk omkring midten eller ej, og hvis ikke, hvor skævt det er.
Hvad betyder det?
Mean er det mest brugte indeks for central tendens. Givet et datasæt beregnes gennemsnittet ved at tage summen af alle dataværdierne og derefter dividere det med antallet af data. For eksempel er vægten af 10 personer (i kilogram) målt til at være 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Så kan middelvægten af de ti personer (i kilogram) være beregnes som følger. Summen af vægtene er 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Middel=(sum) / (antal data)=710 / 10=71 (i kilogram).
Som i dette særlige eksempel er middelværdien af et datasæt muligvis ikke et datapunkt i sættet, men vil være unikt for et givet datasæt. Middel vil have de samme enheder som de originale data. Derfor kan det markeres på samme akse som dataene og kan bruges i sammenligninger. Der er heller ingen tegnbegrænsning for gennemsnittet af et datasæt. Den kan være negativ, nul eller positiv, da summen af datasættet kan være negativ, nul eller positiv.
Hvad er standardafvigelse?
Standardafvigelse er det mest almindeligt anvendte spredningsindeks. For at beregne standardafvigelsen beregnes først dataværdiernes afvigelser fra middelværdien. Kvadratisk middelværdi af afvigelser kaldes standardafvigelsen.
I det foregående eksempel er de respektive afvigelser fra middelværdien (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 og (79-71)=8. Summen af kvadrater af afvigelse er (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Standardafvigelsen er √(366/10)=6,05 (i kilogram). Ud fra dette kan det konkluderes, at størstedelen af dataene er i intervallet 71±6.05, forudsat at datasættet ikke er meget skævt, og det er det faktisk i dette særlige eksempel.
Da standardafvigelsen har de samme enheder som de originale data, giver den os et mål for, hvor meget dataene afviger fra midten; større standardafvigelse større spredning. Standardafvigelsen vil også være en ikke-negativ værdi uanset arten af data i datasættet.
Hvad er forskellen mellem standardafvigelse og middelværdi?
• Standardafvigelse er et mål for spredning fra centrum, hvorimod middelværdi måler placeringen af midten af et datasæt.
• Standardafvigelse er altid en ikke-negativ værdi, men middelværdien kan tage enhver reel værdi.