Regressió vs ANOVA
La regressió i l'ANOVA (anàlisi de la variància) són dos mètodes de la teoria estadística per analitzar el comportament d'una variable en comparació amb una altra. En regressió, sovint és la variació de la variable dependent basada en variable independent, mentre que, en ANOVA, és la variació dels atributs de dues mostres de dues poblacions.
Més sobre la regressió
La regressió és un mètode estadístic utilitzat per dibuixar la relació entre dues variables. Sovint, quan es recullen dades, hi pot haver variables que depenen d' altres. La relació exacta entre aquestes variables només es pot establir mitjançant mètodes de regressió. Determinar aquesta relació ajuda a comprendre i predir el comportament d'una variable respecte a l' altra.
L'aplicació més habitual de l'anàlisi de regressió és estimar el valor de la variable dependent per a un determinat valor o rang de valors de les variables dependents. Per exemple, mitjançant la regressió podem establir la relació entre el preu de la mercaderia i el consum a partir de les dades recollides d'una mostra aleatòria. L'anàlisi de regressió produirà una funció de regressió del conjunt de dades, que és un model matemàtic que s'ajusta millor a les dades disponibles. Això es pot representar fàcilment mitjançant un diagrama de dispersió. La regressió gràfica és equivalent a trobar la millor corba d'ajust per al conjunt de dades donat. La funció de la corba és la funció de regressió. Utilitzant el model matemàtic, es pot predir l'ús d'una mercaderia per a un preu determinat.
Per tant, l'anàlisi de regressió s'utilitza àmpliament en la predicció i la predicció. També s'utilitza per establir relacions en dades experimentals, en els camps de la física, la química i moltes ciències naturals i disciplines d'enginyeria. Si la relació o la funció de regressió és una funció lineal, el procés es coneix com a regressió lineal. En el diagrama de dispersió, es pot representar com una línia recta. Si la funció no és una combinació lineal dels paràmetres, aleshores la regressió és no lineal.
Més informació sobre l'ANOVA (anàlisi de la variància)
ANOVA no implica l'anàlisi d'una relació entre dues o més variables de manera explícita. Més aviat comprova si dues o més mostres de diferents poblacions tenen la mateixa mitjana. Per exemple, considereu els resultats d'un examen realitzat per a una nota a l'escola. Tot i que les proves són diferents, el rendiment pot ser igual d'una classe a una altra. Un mètode per verificar-ho és comparant les mitjanes de cada classe. L'ANOVA o anàlisi de la variància permet comprovar aquesta hipòtesi. En el principi, l'ANOVA es pot considerar com una extensió de la prova t, on es comparen les mitjanes de les dues mostres extretes de dues poblacions.
La idea fonamental de l'ANOVA és considerar la variació dins de la mostra i la variació entre les mostres. La variació dins de la mostra es pot atribuir a l'aleatorietat, mentre que la variació entre mostres es pot atribuir tant a l'aleatorietat com a altres factors externs. L'anàlisi de la variància es basa en tres models; model d'efectes fixos, model d'efectes aleatoris i model d'efectes mixts.
Quina diferència hi ha entre la regressió i l'ANOVA?
• L'ANOVA és l'anàlisi de la variació entre dues o més mostres, mentre que la regressió és l'anàlisi d'una relació entre dues o més variables.
• La teoria ANOVA s'aplica mitjançant tres models bàsics (model d'efectes fixos, model d'efectes aleatoris i model d'efectes mixtos), mentre que la regressió s'aplica mitjançant dos models (model de regressió lineal i model de regressió múltiple).
• ANOVA i regressió són dues versions del model lineal general (GLM). L'ANOVA es basa en variables predictores categòriques, mentre que la regressió es basa en variables predictores quantitatives.
• La regressió és la tècnica més flexible i s'utilitza per a la predicció i la predicció, mentre que l'ANOVA s'utilitza per comparar la igu altat de dues o més poblacions.