Wat is de lineaire regressielijn? + Voorbeeld

Wat is de lineaire regressielijn? + Voorbeeld
Anonim

Het is de lijn die het dichtst bij variabelen past als er een lineaire correlatie zou moeten zijn.

Voorbeeld:

In mijn functie als docent had ik het gevoel dat studenten die goed scoorden in wiskunde ook goed scoorden in natuurkunde en vice versa.

Dus maakte ik een spreidingsdiagram op een grafiek in Excel, waarbij x = Maths en y = Physics, waarbij elke student een punt vertegenwoordigde.

Ik merkte dat de verzameling van punten leek op een sigaarvorm in plaats van helemaal over de plaats te zijn (de laatste zou helemaal geen correlatie betekenen).

En toen deed ik twee dingen:

(1) Ik had de correlatiecoëfficiënt berekend (die hoog was)

(2) Ik had de "lijn van beste fit" getekend

De laatste is de regressielijn en je kunt er zelfs een vergelijking aan hangen.

Hieruit kunt u een min of meer redelijke voorspelling maken van de ene score van de andere, afhankelijk van hoe goed de correlatie is (correlatie is een ander onderwerp).

Opmerking:

Er zijn veel 'buts' en 'ifs'. Om te beginnen moet je er redelijk zeker van zijn dat de correlatie lineair is.