Association vs Correlation
Association og korrelation er to metoder til at forklare en sammenhæng mellem to statistiske variable. Association refererer til en mere generaliseret term, og korrelation kan betragtes som et særligt tilfælde af association, hvor forholdet mellem variablerne er lineært.
Hvad er association?
Det statistiske udtryk association er defineret som et forhold mellem to tilfældige variable, hvilket gør dem statistisk afhængige. Det refererer snarere til en generel sammenhæng, uden at der er nævnt noget om forholdet, og det er ikke nødvendigt at være en årsagssammenhæng.
Mange statistiske metoder bruges til at etablere sammenhængen mellem to variable. Pearsons korrelationskoefficient, oddsforhold, afstandskorrelation, Goodmans og Kruskals Lambda og Spearmans rho (ρ) er nogle få eksempler.
Hvad er korrelation?
Korrelation er et mål for styrken af forholdet mellem to variable. Korrelationskoefficienten kvantificerer graden af ændring af en variabel baseret på ændringen af den anden variabel. I statistik er korrelation forbundet med begrebet afhængighed, som er den statistiske sammenhæng mellem to variable
Pearsons korrelationskoefficient eller bare korrelationskoefficienten r er en værdi mellem -1 og 1 (-1≤r≤+1). Det er den mest almindeligt anvendte korrelationskoefficient og kun gyldig for et lineært forhold mellem variablerne. Hvis r=0, eksisterer der ingen sammenhæng, og hvis r≥0, er sammenhængen direkte proportional; værdien af en variabel stiger med stigningen i den anden. Hvis r≤0, er forholdet omvendt proportional; én variabel falder, efterhånden som den anden stiger.
På grund af linearitetsbetingelsen kan korrelationskoefficienten r også bruges til at fastslå tilstedeværelsen af en lineær sammenhæng mellem variablerne.
Spearmans rangkorrelationskoefficient og Kendralls rangkorrelationskoefficient måler styrken af forholdet, eksklusive den lineære faktor. De overvejer, i hvor høj grad den ene variabel stiger eller falder med den anden. Hvis begge variabler stiger sammen, vil koefficienten være positiv, og hvis en variabel stiger, mens den anden falder, vil koefficientværdien være negativ.
Rangkorrelationskoefficienterne bruges kun til at fastslå typen af forholdet, men ikke til at undersøge i detaljer som Pearsons korrelationskoefficient. De bruges også til at reducere beregningerne og gøre resultaterne mere uafhængige af unormaliteten af de betragtede fordelinger.
Hvad er forskellen mellem association og korrelation?
• Association refererer til den generelle sammenhæng mellem to stokastiske variable, mens korrelationen refererer til en mere eller mindre lineær sammenhæng mellem de stokastiske variable.
• Association er et begreb, men korrelation er et mål for association, og matematiske værktøjer leveres til at måle størrelsen af korrelationen.
• Pearsons produktmoment-korrelationskoefficient etablerer tilstedeværelsen af en lineær sammenhæng og bestemmer arten af sammenhængen (om de er proportionale eller omvendt proportionale).
• Rangkorrelationskoefficienter bruges kun til at bestemme arten af sammenhængen, eksklusive lineariteten af relationen (den kan være lineær eller ikke, men den vil fortælle om variablerne stiger sammen, falder sammen eller én øges mens den anden falder eller omvendt).