Waarom geeft een R-vierkant-waarde niets aan over oorzaak en gevolg?

Waarom geeft een R-vierkant-waarde niets aan over oorzaak en gevolg?
Anonim

Antwoord:

Een R-kwadraat geeft aan hoe goed de geobserveerde gegevens passen bij de verwachte gegevens, maar geeft alleen informatie over de correlatie.

Uitleg:

Een R-kwadratische waarde geeft aan hoe goed uw geobserveerde gegevens of de gegevens die u hebt verzameld, in een verwachte trend passen. Deze waarde vertelt je de kracht van de relatie, maar net als bij alle statistische tests is er niets dat je de oorzaak achter de relatie of de kracht vertelt.

In het onderstaande voorbeeld kunnen we zien dat de grafiek links geen relatie heeft, zoals aangegeven door een lage R-kwadraatwaarde. De grafiek aan de rechterkant heeft een zeer sterke relatie, als indicatie door de R-kwadraatwaarde van 1. In geen van deze grafieken kunnen we zien wat deze relatie uiteindelijk veroorzaakt.

Correlatie betekent niet causaliteit. Uw X-waarden kunnen heel goed van invloed zijn op uw Y-waarden, maar er kunnen andere factoren spelen of de relatie kan aan toeval te wijten zijn. Jij kan afleiden oorzaak, maar dit is uw interpretatie en het kan niet worden bewezen door statistische tests. Het hebben van een hoge R-kwadraatwaarde vertelt je nog steeds alleen de kracht van de relatie, maar niet de oorzaak ervan.

Het aantonen van oorzakelijk verband is een zeer grote taak. Als je veroorzaking wilt begrijpen, kun je het beste experimenteren.