Sample vs Population
Population og Sample er to vigtige udtryk i emnet 'Statistik'. Enkelt sagt er populationen den største samling af genstande, som vi er interesseret i at studere, og stikprøven er en delmængde af en population. Med andre ord bør stikprøven repræsentere populationen med færre men tilstrækkeligt antal emner. En population kan have flere prøver med forskellige størrelser.
Eksempel
En stikprøve kan bestå af to eller flere elementer, der er udvalgt fra populationen. Den lavest mulige størrelse for en stikprøve er to, og den højeste ville svare til populationens størrelse. Der er flere måder at vælge en stikprøve fra en population på. Teoretisk set er udvælgelsen af en 'tilfældig prøve' den bedste måde at opnå nøjagtige slutninger om befolkningen på. Denne type stikprøver kaldes også sandsynlighedsstikprøver, da alle elementer i populationen har lige muligheder for at blive inkluderet i en stikprøve.
'Simple random sampling'-teknik er den mest berømte tilfældige prøveudtagningsteknik. I dette tilfælde vælges elementer, der skal udvælges til stikprøven, tilfældigt fra populationen. En sådan prøve kaldes en 'Simple Random Sample' eller SRS. En anden populær teknik er 'systematisk prøveudtagning'. I dette tilfælde vælges varerne til en prøve baseret på en bestemt systematisk rækkefølge.
Eksempel: Hver 10. person i køen er udvalgt til en prøve.
I dette tilfælde er den systematiske ordre hver 10. person. Statistikeren kan frit definere denne rækkefølge på en meningsfuld måde. Der er andre tilfældige prøvetagningsteknikker såsom klyngeprøvetagning eller stratificeret prøveudtagning, og udvælgelsesmetoden er lidt anderledes end de to ovenstående.
Til praktiske formål kan ikke-tilfældige prøver såsom bekvemmelighedsprøver, bedømmelsesprøver, sneboldprøver og formålsprøver bruges. Mere over, elementer udvalgt til en ikke-tilfældig stikprøve vedrører en chance. Faktisk har enhver del af befolkningen ikke lige mulighed for at blive inkluderet i en ikke-tilfældig stikprøve. Disse typer stikprøver kaldes også ikke-sandsynlighedsprøver.
Befolkning
Enhver samling af enheder, som er interessante at undersøge, defineres ganske enkelt som 'befolkning'. Population er grundlaget for prøver. Ethvert sæt objekter i universet kan være en population baseret på undersøgelseserklæringen. Generelt bør en population være forholdsvis stor i størrelse og svær at udlede nogle karakteristika ved at overveje dens elementer individuelt. De målinger, der skal undersøges i populationen, kaldes parametre. I praksis estimeres parametrene ved hjælp af statistik, som er de relevante målinger af stikprøven.
Eksempel: Når man estimerer det gennemsnitlige matematikkarakter for 30 elever i en klasse ud fra det gennemsnitlige matematikkarakter for 5 elever, er parameteren klassens gennemsnitlige matematikkarakter. Statistikken er den gennemsnitlige matematikkarakter for 5 elever.
Sample vs Population
Det interessante forhold mellem stikprøven og populationen er, at populationen kan eksistere uden en stikprøve, men stikprøven eksisterer muligvis ikke uden population. Dette argument beviser yderligere, at en prøve afhænger af en population, men interessant nok afhænger de fleste af populationsslutningerne af stikprøven. Hovedformålet med en stikprøve er at estimere eller udlede nogle målinger af en population så nøjagtige som muligt. En højere nøjagtighed kan udledes af det samlede resultat opnået fra flere prøver af samme population i stedet for fra en prøve. En anden vigtig ting at vide er, når man vælger mere end én stikprøve fra en population, kan én vare også inkluderes i en anden stikprøve. Denne sag er kendt som 'prøver med erstatninger'. Desuden er det en gylden mulighed for at spare omkostninger og tidsværdi at investere de relevante målinger af populationen fra en stikprøve og opnå næsten ens output.
Det er afgørende at vide, at når stikprøvestørrelsen øges, øges nøjagtigheden af estimatet for populationsparameteren også. Logisk set bør stikprøvestørrelsen ikke være for lille for at få bedre estimater for populationen. Yderligere bør tilfældige prøver også anses for at have bedre skøn. Derfor er det afgørende at være opmærksom på størrelsen og tilfældigheden af stikprøven for at være repræsentativ for at få de bedste estimater for populationen.