Forskellen mellem varians og kovarians

Video: Forskellen mellem varians og kovarians

Video: The Normal Distribution, Clearly Explained!!! 2024, Juli

2024 Forfatter: Alex Aldridge | [email protected]. Sidst ændret: 2023-12-17 13:35

Variance vs Covariance

Varians og kovarians er to mål, der bruges i statistik. Varians er et mål for spredningen af dataene, og kovarians angiver graden af ændring af to tilfældige variable sammen. Varians er snarere et intuitivt begreb, men kovarians defineres matematisk i ikke så intuitivt i starten.

Mere om Variance

Varians er et mål for spredning af data fra middelværdien af fordelingen. Det fortæller, hvor langt datapunkterne ligger fra middelværdien af fordelingen. Det er en af de primære deskriptorer for sandsynlighedsfordelingen og et af fordelingens momenter. Varians er også en parameter for populationen, og variansen af en stikprøve fra populationen fungerer som en estimator for variansen af populationen. Fra ét perspektiv er det defineret som kvadratet af standardafvigelsen.

I almindeligt sprog kan det beskrives som gennemsnittet af kvadraterne af afstanden mellem hvert datapunkt og middelværdien af fordelingen. Følgende formel bruges til at beregne variansen.

Var(X)=E[(X-µ)^{2] for en befolkning, og}

Var(X)=E[(X-‾x)^{2] for en prøve}

Det kan yderligere forenkles at give Var(X)=E[X²]-(E[X])^2.

Variance har nogle signaturegenskaber og bruges ofte i statistik for at gøre brugen enklere. Varians er ikke-negativ, fordi den er kvadratet af afstandene. Variansens rækkevidde er dog ikke begrænset og afhænger af den særlige fordeling. Variansen af en konstant tilfældig variabel er nul, og variansen ændres ikke i forhold til en placeringsparameter.

Mere om Covariance

I statistisk teori er kovarians et mål for, hvor meget to tilfældige variable ændres sammen. Med andre ord er kovarians et mål for styrken af korrelationen mellem to stokastiske variable. Det kan også betragtes som en generalisering af begrebet varians for to tilfældige variable.

Kovarians af to stokastiske variable X og Y, som er fordelt i fællesskab med endeligt andet momentum, er kendt som σ_{XY=E[(X-E[X])(Y-E[Y])]. Ud fra dette kan varians ses som et særligt tilfælde af kovarians, hvor to variable er ens. Cov(X, X)=Var(X)}

Ved at normalisere kovariansen kan den lineære korrelationskoefficient eller Pearsons korrelationskoefficient opnås, som er defineret som ρ=E[(X-E[X])(Y-E[Y])]/(σ X _σY_{)=(Cov(X, Y))/(σ}X _σY ₎

Grafisk kan kovarians mellem et par datapunkter ses som arealet af rektanglet med datapunkterne i de modsatte hjørner. Det kan fortolkes som et mål for størrelsen af adskillelsen mellem de to datapunkter. I betragtning af rektanglerne for hele populationen kan overlapningen af rektanglerne svarende til alle datapunkter betragtes som styrken af adskillelsen; varians af de to variable. Kovarians er i to dimensioner på grund af to variable, men at forenkle den til én variabel giver variansen af en enkelt som adskillelsen i én dimension.

Hvad er forskellen mellem Variance og Covariance?

• Varians er målet for spredning/spredning i en population, mens kovarians betragtes som et mål for variation af to tilfældige variable eller styrken af korrelationen.

• Varians kan betragtes som et særligt tilfælde af kovarians.

• Varians og kovarians er afhængige af størrelsen af dataværdierne og kan ikke sammenlignes; derfor er de normaliserede. Kovarians normaliseres til korrelationskoefficienten (divideret med produktet af standardafvigelserne af de to stokastiske variable) og varians normaliseres til standardafvigelsen (ved at tage kvadratroden)