Median vs. gennemsnit (middel)
Median og middelværdi er mål for central tendens i beskrivende statistik. Ofte betragtes aritmetisk middelværdi som gennemsnittet af et sæt observationer. Derfor betragtes gennemsnittet her som gennemsnittet. Gennemsnit er dog ikke altid det aritmetiske middelværdi.
Average
Det aritmetiske middelværdi er summen af dataværdierne divideret med antallet af dataværdier, dvs.
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Hvis dataene er fra et stikprøverum, kaldes det et stikprøvemiddel ([latex]\bar{x} [/latex]), som er en beskrivende statistik for prøven. Selvom det er det mest almindeligt anvendte beskrivende mål for en prøve, er det ikke en robust statistik. Den er meget følsom over for afvigelser og svingninger.
Tag f.eks. gennemsnitsindkomsten for borgerne i en bestemt by. Da alle dataværdierne summeres og derefter opdeles, påvirker indkomsten for en ekstremt velhavende person gennemsnittet betydeligt. Derfor er middelværdierne ikke altid en god repræsentation af dataene.
I tilfælde af et vekslende signal varierer strømmen, der passerer gennem et element, periodisk fra positiv retning til negativ retning og omvendt. Hvis vi tager den gennemsnitlige strøm, der går gennem elementet i en enkelt periode, vil det give et 0, hvilket betyder, at der ikke er gået strøm gennem elementet, hvilket åbenbart ikke er sandt. Derfor er et aritmetisk gennemsnit heller ikke i dette tilfælde et godt mål.
Det aritmetiske gennemsnit er en god indikator, når dataene er jævnt fordelt. For en normalfordeling er middelværdien lig med mode og medianen. Den har også de laveste residualer, når man betragter rodmiddelkvadrat-fejlen; derfor det bedste beskrivende mål, når det er påkrævet at repræsentere et datasæt med et enkelt tal.
Median
Værdierne af det midterste datapunkt efter at have arrangeret alle dataværdierne i stigende rækkefølge er defineret som medianen af datasættet.
• Hvis antallet af observationer (datapunkter) er ulige, er medianen observationen nøjagtigt i midten af den ordnede liste.
• Hvis antallet af observationer (datapunkter) er lige, så er medianen middelværdien af de to midterste observationer i den ordnede liste.
Median deler observationen i to grupper; dvs. en gruppe (50%) af værdier højere og en gruppe (50%) af værdier lavere end medianen. Medianer bruges specifikt i skæve fordelinger og repræsenterer data nogenlunde bedre end det aritmetiske gennemsnit.
Median vs Mean (Gennemsnit)
• Både middelværdi og median er mål for central tendens og opsummerer dataene. Middelværdi er uafhængig af positionen af datapunkterne, men medianen beregnes ved hjælp af positionen.
• Middel er stærkt påvirket af afvigende værdier, mens medianen ikke er påvirket.
• Derfor er medianen et bedre mål end gennemsnittet i tilfælde af meget skæve fordelinger.
• I standarden, normalfordelinger, er middelværdien og medianen de samme.