Forskellen mellem regression og ANOVA

Forskellen mellem regression og ANOVA
Forskellen mellem regression og ANOVA

Video: Forskellen mellem regression og ANOVA

Video: Forskellen mellem regression og ANOVA
Video: Chi-i-anden - forskel på uafhængighedstest og goodness of fit 2024, Juli
Anonim

Regression vs ANOVA

Regression og ANOVA (Analysis of Variance) er to metoder i den statistiske teori til at analysere adfærden af en variabel sammenlignet med en anden. I regression er det ofte variationen af afhængig variabel baseret på uafhængig variabel, mens det i ANOVA er variationen af attributterne for to stikprøver fra to populationer.

Mere om regression

Regression er en statistisk metode, der bruges til at tegne sammenhængen mellem to variable. Når data indsamles, kan der ofte være variabler, som er afhængige af andre. Den nøjagtige sammenhæng mellem disse variable kan kun etableres ved hjælp af regressionsmetoder. Bestemmelse af denne sammenhæng hjælper med at forstå og forudsige adfærden af en variabel til den anden.

Den mest almindelige anvendelse af regressionsanalysen er at estimere værdien af den afhængige variabel for en given værdi eller række af værdier for de afhængige variable. For eksempel kan vi ved hjælp af regression etablere sammenhængen mellem varepris og forbrug baseret på data indsamlet fra en tilfældig stikprøve. Regressionsanalyse vil producere en regressionsfunktion af datasættet, som er en matematisk model, der passer bedst til de tilgængelige data. Dette kan nemt repræsenteres af et scatter plot. Grafisk set svarer regression til at finde den bedst passende kurve for det givne datasæt. Kurvens funktion er regressionsfunktionen. Ved hjælp af den matematiske model kan brugen af en vare forudsiges til en given pris.

Regressionsanalysen er derfor meget brugt til forudsigelse og prognose. Det bruges også til at etablere relationer i eksperimentelle data inden for fysik, kemi og mange naturvidenskabelige og tekniske discipliner. Hvis forholdet eller regressionsfunktionen er en lineær funktion, er processen kendt som en lineær regression. I spredningsplottet kan det repræsenteres som en ret linje. Hvis funktionen ikke er en lineær kombination af parametrene, er regressionen ikke-lineær.

Mere om ANOVA (Analysis of Variance)

ANOVA involverer ikke eksplicit analyse af en relation mellem to eller flere variable. Det kontrollerer snarere, om to eller flere prøver fra forskellige populationer har samme gennemsnit. Overvej for eksempel testresultaterne af en eksamen afholdt for en karakter i skolen. Selvom testene er forskellige, kan præstationen være ens fra klasse til klasse. En metode til at verificere dette er ved at sammenligne midlerne for hver klasse. ANOVA eller ANAlysis Of Variance gør det muligt at teste denne hypotese. Grundlæggende kan ANOVA betragtes som en forlængelse af t-testen, hvor gennemsnittet af de to stikprøver fra to populationer sammenlignes.

Fundamental idé med ANOVA er at overveje variationen i stikprøven og variation mellem prøverne. Variationen inden for stikprøven kan tilskrives tilfældigheden, hvorimod variationen blandt stikprøverne kan tilskrives både tilfældighed og andre eksterne faktorer. Variansanalyse er baseret på tre modeller; model med faste effekter, model med tilfældige effekter og model med blandede effekter.

Hvad er forskellen mellem regression og ANOVA?

• ANOVA er analysen af variation mellem to eller flere stikprøver, mens regression er analysen af en relation mellem to eller flere variable.

• ANOVA-teori anvendes ved hjælp af tre grundlæggende modeller (model med faste effekter, model med tilfældige effekter og model med blandede effekter), mens regression anvendes ved hjælp af to modeller (lineær regressionsmodel og multipel regressionsmodel).

• ANOVA og regression er begge to versioner af den generelle lineære model (GLM). ANOVA er baseret på kategoriske prædiktorvariable, mens regression er baseret på kvantitative prædiktorvariable.

• Regression er den mere fleksible teknik, og den bruges til at forudsige og forudsige, mens ANOVA bruges til at sammenligne ligheden mellem to eller flere populationer.

Anbefalede: