Parametrisk vs. Ikke-parametrisk
Statistik er en gren af undersøgelser, som giver os mulighed for at forstå populationsdynamikken ved at bruge stikprøver fra en bestemt population af interesse. Det er vigtigt, at disse prøver er tilfældige. Mange formler er skabt med inkorporering af matematik for at tage slutninger om befolkningsparametre. Naturligvis kan enhver population have en "normal fordeling", hvor spredningen af data/prøver har form som en klokke i frekvensgrafen. I en normalfordeling koncentrerer de fleste prøver sig omkring gennemsnittet, og 68 %, 95 %, 99 % af data findes inden for henholdsvis 1, 2 og 3 standardafvigelser. Parametrisk og ikke-parametrisk statistik afhænger af, om normalfordelingen tages i betragtning eller ej.
Hvad er parametrisk statistik?
Parametrisk statistik er den statistik, hvor data/stikprøver betragtes som trukket fra en normalfordeling. Definitionen af parametrisk statistik er "den statistik, der antager, at dataene kommer fra en form for sandsynlighedsfordeling og gør slutninger om fordelingens parametre". De fleste af de kendte elementære statistiske metoder tilhører denne gruppe. I virkeligheden er de måske ikke normalfordelte. Derfor er denne statistiktype baseret på flere antagelser. Hvis dataene/prøverne er normalfordelte eller næsten normalfordelte, kan formlerne give nøjagtige resultater og slutninger. Men hvis antagelsen om at være normalfordelt er forkert, kan parametriske statistikker være ret misvisende.
Hvad er ikke-parametrisk statistik?
Ikke-parametrisk statistik er også kendt som distributionsfri statistik. Fordelen ved denne statistiktype er, at den ikke behøver at lave en antagelse som tidligere lavet med parametri. Ikke-parametriske statistiske beregninger tager medianer i opmærksomhed end middelværdierne. Derfor, hvis en eller to afviger fra middelværdien, negligeres deres effekt. Generelt foretrækkes parametrisk statistik end dette, fordi den har mere magt til at afvise en falsk hypotese end ikke-parametrisk metode. En af de mest kendte ikke-parametriske test er Chi-square test. Der er ikke-parametriske analoger til nogle parametriske test, såsom Wilcoxon T Test for parret prøve t-test, Mann-Whitney U Test for uafhængige prøver t-test, Spearmans korrelation for Pearsons korrelation osv. For en prøve t-test er der ingen sammenlignelig ikke-parametrisk test.
Hvad er forskellen mellem parametrisk og ikke-parametrisk?
• Parametrisk statistik afhænger af normalfordeling, men ikke-parametrisk statistik afhænger ikke af normalfordeling.
• Parametriske statistikker gør flere antagelser end ikke-parametriske statistikker.
• Parametriske statistikker bruger enklere formler i sammenligning med ikke-parametriske statistikker.
• Når en population menes at være normalfordelt eller tæt på normalfordelt, er parametrisk statistik den bedste at bruge. Hvis ikke, er det bedst at bruge en ikke-parametrisk metode.
• De fleste af de almindeligt kendte elementære statistiske metoder tilhører parametrisk statistik. Ikke-parametrisk statistik bruges sparsomt og anvendes i særlige tilfælde.