Hoe voer ik lineaire regressie uit op gegevens?

Hoe voer ik lineaire regressie uit op gegevens?
Anonim

Antwoord:

U moet het volledige antwoord zien om het te begrijpen

Uitleg:

Ik weet niet helemaal wat je bedoelt, je krijgt eerst je dataset waarin je teruggaat naar x om te zien hoe een verandering in x y effectueert.

x y

1 4

2 6

3 7

4 6

5 2

En je wilt de relatie tussen x en y vinden, dus zeg dat je denkt dat het model is

# Y = mx + c #

of in statistieken

# Y = beta_0 beta_1x + + u #

deze # Beta_0, beta_1 # zijn de parameters in de populatie en # U # is het effect van niet-geobserveerde variabelen die ook wel de foutterm wordt genoemd, dus u wilt schatters # Hatbeta_0, hatbeta_1 #

Zo # HATY = hatbeta_0 + hatbeta_1x #

Dit vertelt u dat de voorspelde coëfficiënten u de voorspelde y-waarde zullen geven.

Dus nu wilt u de beste schattingen voor deze co-efficiënties vinden we dit doen door het vinden van het laagste verschil tussen de werkelijke y-waarde en voorspeld.

#min sum_ (i = 1) ^ nhatu_i ^ 2 ~ hatbeta_0, hatbeta_1 #

Dit zegt in feite dat u het minimum wilt van de som van de verschillen tussen de actuele y-waarden en voorspelde y-waarden voor uw regressielijn

Dus de formules om ze te vinden zijn

# hatbeta_1 = (sum_ (i = 1) ^ n (x_i- barx) (y_i-bary)) / (sum_ (i = 1) ^ n (x_i-barx) ^ 2) #

# Hatbeta_0 = bary-hatbeta_1barx #