Forskellen mellem lineær og logistisk regression

Forskellen mellem lineær og logistisk regression
Forskellen mellem lineær og logistisk regression

Video: Forskellen mellem lineær og logistisk regression

Video: Forskellen mellem lineær og logistisk regression
Video: Веселье с музыкой и программированием Коннора Харриса и Стивена Крюсона 2024, November
Anonim

Lineær vs logistisk regression

I statistisk analyse er det vigtigt at identificere relationerne mellem variabler, der er relevante for undersøgelsen. Nogle gange kan det være det eneste formål med selve analysen. Et stærkt værktøj, der bruges til at fastslå eksistensen af relationer og identificere sammenhængen, er regressionsanalyse.

Den enkleste form for regressionsanalyse er den lineære regression, hvor relationen mellem variablerne er en lineær sammenhæng. I statistiske termer bringer det forholdet mellem den forklarende variabel og responsvariablen frem. For eksempel kan vi ved hjælp af regression etablere sammenhængen mellem vareprisen og forbruget baseret på data indsamlet fra en tilfældig stikprøve. Regressionsanalyse vil producere en regressionsfunktion af datasættet, som er en matematisk model, der bedst passer til de tilgængelige data. Dette kan nemt repræsenteres af et scatter plot. Grafisk set svarer regression til at finde den bedst passende kurve for det givne datasæt. Kurvens funktion er regressionsfunktionen. Ved at bruge den matematiske model kan brugen af en vare forudsiges til en given pris.

Regressionsanalysen er derfor meget brugt til forudsigelse og prognose. Det bruges også til at etablere sammenhænge i eksperimentelle data inden for fysik, kemi og i mange naturvidenskabelige og tekniske discipliner. Hvis forholdet eller regressionsfunktionen er en lineær funktion, er processen kendt som en lineær regression. I spredningsplottet kan det repræsenteres som en ret linje. Hvis funktionen ikke er en lineær kombination af parametrene, er regressionen ikke-lineær.

Logistisk regression kan sammenlignes med multivariat regression, og den skaber en model til at forklare virkningen af flere prædiktorer på en responsvariabel. I logistisk regression bør slutresultatvariablen dog være kategorisk (norm alt opdelt; dvs. et par opnåelige resultater, som død eller overlevelse, selvom specielle teknikker gør det muligt at modellere mere kategoriseret information). En kontinuerlig udfaldsvariabel kan transformeres til en kategorisk variabel, der skal bruges til logistisk regression; Det frarådes dog for det meste at sammenklappe kontinuerte variabler på denne måde, fordi det reducerer nøjagtigheden.

I modsætning til i den lineære regression, mod middelværdien, behøver prædiktorvariablerne i logistisk regression ikke at være tvunget til at være lineært forbundet, almindeligt fordelt eller have samme varians inden for hver klynge. Som et resultat heraf er forholdet mellem prædiktoren og udfaldsvariablen sandsynligvis ikke en lineær funktion.

Hvad er forskellen mellem logistisk og lineær regression?

• I lineær regression antages en lineær relation mellem den forklarende variabel og responsvariablen, og parametre, der opfylder modellen, findes ved analyse for at give den nøjagtige sammenhæng.

• Lineær regression udføres for kvantitative variable, og den resulterende funktion er en kvantitativ.

• I den logistiske regression kan anvendte data enten være kategoriske eller kvantitative, men resultatet er altid kategorisk.

Anbefalede: