Regressió versus correlació
En estadístiques, és important determinar la relació entre dues variables aleatòries. Dóna la capacitat de fer prediccions sobre una variable en relació amb altres. L'anàlisi de regressió i la correlació s'apliquen en les previsions meteorològiques, el comportament dels mercats financers, l'establiment de relacions físiques mitjançant experiments i en escenaris molt més reals.
Què és la regressió?
La regressió és un mètode estadístic utilitzat per dibuixar la relació entre dues variables. Sovint, quan es recullen dades, hi pot haver variables que depenen d' altres. La relació exacta entre aquestes variables només es pot establir mitjançant els mètodes de regressió. Determinar aquesta relació ajuda a comprendre i predir el comportament d'una variable respecte a l' altra.
L'aplicació més habitual de l'anàlisi de regressió és estimar el valor de la variable dependent per a un valor determinat o rang de valors de les variables independents. Per exemple, mitjançant la regressió podem establir la relació entre el preu de la mercaderia i el consum, a partir de les dades recollides d'una mostra aleatòria. L'anàlisi de regressió produeix la funció de regressió d'un conjunt de dades, que és un model matemàtic que s'adapta millor a les dades disponibles. Això es pot representar fàcilment mitjançant un diagrama de dispersió. Gràficament, la regressió és equivalent a trobar la millor corba d'ajust per al conjunt de dades donat. La funció de la corba és la funció de regressió. Utilitzant el model matemàtic, es pot predir la demanda d'una mercaderia per a un preu determinat.
Per tant, l'anàlisi de regressió s'utilitza àmpliament en la predicció i la predicció. També s'utilitza per establir relacions en dades experimentals, en els camps de la física, la química i moltes ciències naturals i disciplines d'enginyeria. Si la relació o la funció de regressió és una funció lineal, el procés es coneix com a regressió lineal. En el diagrama de dispersió, es pot representar com una línia recta. Si la funció no és una combinació lineal dels paràmetres, aleshores la regressió és no lineal.
Què és la correlació?
La correlació és una mesura de la força de la relació entre dues variables. El coeficient de correlació quantifica el grau de canvi d'una variable en funció del canvi de l' altra variable. En estadística, la correlació està relacionada amb el concepte de dependència, que és la relació estadística entre dues variables.
El coeficient de correlació de Pearson o només el coeficient de correlació r és un valor entre -1 i 1 (-1≤r≤+1). És el coeficient de correlació més utilitzat i vàlid només per a una relació lineal entre les variables. Si r=0, no existeix cap relació, i si r≥0, la relació és directament proporcional; és a dir, el valor d'una variable augmenta amb l'augment de l' altra. Si r≤0, la relació és inversament proporcional; és a dir, una variable disminueix a mesura que augmenta l' altra.
A causa de la condició de linealitat, el coeficient de correlació r també es pot utilitzar per establir la presència d'una relació lineal entre les variables.
Quina diferència hi ha entre la regressió i la correlació?
La regressió dóna la forma de la relació entre dues variables aleatòries i la correlació dóna el grau de força de la relació.
L'anàlisi de regressió produeix una funció de regressió, que ajuda a extrapolar i predir resultats, mentre que la correlació només pot proporcionar informació sobre quina direcció pot canviar.
L'anàlisi dóna els models de regressió lineal més precisos, si el coeficient de correlació és més alt. (|r|≥0,8)