Forskellen mellem middelværdi, median og tilstand

Forskellen mellem middelværdi, median og tilstand
Forskellen mellem middelværdi, median og tilstand

Video: Forskellen mellem middelværdi, median og tilstand

Video: Forskellen mellem middelværdi, median og tilstand
Video: Areal af parallelogram og trapez 2024, November
Anonim

Mean vs Median vs Mode

Middelværdi, median og tilstand er de primære mål for central tendens, der bruges i beskrivende statistik. De er fuldstændig forskellige fra hinanden, og de tilfælde, hvor de bruges til at opsummere dataene, er også forskellige.

Mean

Det aritmetiske middelværdi er summen af dataværdierne divideret med antallet af dataværdier, dvs.

[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]

Hvis dataene er fra et stikprøverum, kaldes det et stikprøvemiddel ([latex]\bar{x} [/latex]), som er en beskrivende statistik for prøven. Selvom det er det mest almindeligt anvendte beskrivende mål for en prøve, er det ikke en robust statistik. Den er meget følsom over for afvigelser og svingninger.

Tag f.eks. gennemsnitsindkomsten for borgerne i en bestemt by. Da alle dataværdierne summeres og derefter opdeles, påvirker indkomsten for en ekstremt velhavende person gennemsnittet betydeligt. Derfor er middelværdierne ikke altid en god repræsentation af dataene.

I tilfælde af et vekslende signal varierer strømmen, der passerer gennem et element, periodisk fra positiv retning til negativ retning og omvendt. Hvis vi tager den gennemsnitlige strøm, der går gennem elementet i en enkelt periode, vil det give et 0, hvilket betyder, at der ikke er gået strøm gennem elementet, hvilket åbenbart ikke er sandt. Derfor er et aritmetisk gennemsnit heller ikke i dette tilfælde et godt mål.

Det aritmetiske gennemsnit er en god indikator, når dataene er jævnt fordelt. For en normalfordeling er middelværdien lig med mode og medianen. Den har også de laveste residualer, når man betragter rodmiddelkvadrat-fejlen; derfor det bedste beskrivende mål, når det er påkrævet at repræsentere et datasæt med et enkelt tal.

Median

Værdierne af det midterste datapunkt efter at have arrangeret alle dataværdierne i stigende rækkefølge er defineret som medianen af datasættet. Medianen er 2. kvartil, 5. decil og 50. percentil.

• Hvis antallet af observationer (datapunkter) er ulige, er medianen observationen nøjagtigt i midten af den ordnede liste.

• Hvis antallet af observationer (datapunkter) er lige, så er medianen middelværdien af de to midterste observationer i den ordnede liste.

Median deler observationen i to grupper; dvs. en gruppe (50%) af værdier højere og en gruppe (50%) af værdier lavere end medianen. Medianer bruges specifikt i skæve fordelinger og repræsenterer data nogenlunde bedre end det aritmetiske gennemsnit.

Tilstand

Tilstand er det mest forekommende tal i et sæt observationer. Et datasæts tilstand beregnes ved at finde frekvensen af hvert element i sættet.

• Hvis ingen værdi forekommer mere end én gang, har datasættet ingen tilstand.

• Ellers er enhver værdi, der forekommer med den største frekvens, en tilstand for datasættet.

Mere end 1 tilstand kan eksistere i et sæt; derfor er tilstand ikke en unik statistik for et datasæt. I en ensartet fordeling er der én tilstand. Moden for en diskret sandsynlighedsfordeling er det punkt, hvor sandsynlighedsmassefunktionen når sit højeste punkt. Gengivelse fra ovenstående fortolkninger kan vi sige, at globale maksima er tilstande.

Overvej anvendelsen af alle tre mål på følgende datasæt.

DATA: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Mean=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12

Median=9 (13. element)

Tilstand=9 (frekvens på 9=5)

Hvad er forskellen mellem middelværdi, median og tilstand?

• Aritmetisk middelværdi er summen af værdierne (observationerne) divideret med antallet af observationer. Det er ikke en robust statistik og stærkt afhængig af normalfordelingen inden for den betragtede fordeling. En enkelt outlier kan forårsage en signifikant ændring i middelværdien, hvilket giver relativt misvisende værdier. Begrebet kan udvides til geometrisk middelværdi, harmonisk middelværdi, vægtet middelværdi og så videre.

• Median er de midterste værdier af observationssættet, og det er relativt mindre påvirket af outliers. Det kan give et godt skøn som den sammenfattende statistik i meget skæve tilfælde.

• Mode er de mest almindelige observationsværdier i datasættet. Hvis fordelingen er positiv skæv, ligger tilstanden til venstre for medianen, og hvis den er negativ skæv, ligger tilstanden lige til medianen.

• Hvis positivt skæv, er middelværdien lige til medianen; hvis negativt skævt middel er til venstre for medianen.

• I normalfordelingen er alle tre, middelværdi, mode og median ens.

Anbefalede: