Variància vs covariància
La variància i la covariància són dues mesures que s'utilitzen en estadístiques. La variància és una mesura de la dispersió de les dades i la covariància indica el grau de canvi de dues variables aleatòries juntes. La variància és més aviat un concepte intuïtiu, però la covariància es defineix matemàticament en un principi no tan intuïtiu.
Més sobre Variance
La variància és una mesura de la dispersió de les dades a partir del valor mitjà de la distribució. Indica a quina distància es troben els punts de dades de la mitjana de la distribució. És un dels descriptors primaris de la distribució de probabilitat i un dels moments de la distribució. A més, la variància és un paràmetre de la població, i la variància d'una mostra de la població actua com a estimador de la variància de la població. Des d'una perspectiva, es defineix com el quadrat de la desviació estàndard.
En llenguatge senzill, es pot descriure com la mitjana dels quadrats de la distància entre cada punt de dades i la mitjana de la distribució. La fórmula següent s'utilitza per calcular la variància.
Var(X)=E[(X-µ)2] per a una població, i
Var(X)=E[(X-‾x)2] per a una mostra
Es pot simplificar encara més per donar Var(X)=E[X2]-(E[X])2.
Variance té algunes propietats de signatura i sovint s'utilitza a les estadístiques per simplificar l'ús. La variància no és negativa perquè és el quadrat de les distàncies. Tanmateix, el rang de la variància no està limitat i depèn de la distribució particular. La variància d'una variable aleatòria constant és zero i la variància no canvia respecte a un paràmetre d'ubicació.
Més sobre la covariància
En teoria estadística, la covariància és una mesura de quant canvien dues variables aleatòries juntes. En altres paraules, la covariància és una mesura de la força de la correlació entre dues variables aleatòries. A més, es pot considerar com una generalització del concepte de variància de dues variables aleatòries.
La covariància de dues variables aleatòries X i Y, que es distribueixen conjuntament amb un segon moment finit, es coneix com σXY=E[(X-E[X])(Y-E[Y])]. A partir d'això, la variància es pot veure com un cas especial de covariància, on dues variables són iguals. Cov(X, X)=Var(X)
Normalitzant la covariància, es pot obtenir el coeficient de correlació lineal o el coeficient de correlació de Pearson, que es defineix com ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Gràficament, la covariància entre un parell de punts de dades es pot veure com l'àrea del rectangle amb els punts de dades als vèrtexs oposats. Es pot interpretar com una mesura de la magnitud de la separació entre els dos punts de dades. Tenint en compte els rectangles per a tota la població, la superposició dels rectangles corresponents a tots els punts de dades es pot considerar com la força de la separació; variància de les dues variables. La covariància és en dues dimensions, a causa de dues variables, però simplificar-la a una variable dóna la variància d'una sola com a separació en una dimensió.
Quina diferència hi ha entre la variància i la covariància?
• La variància és la mesura de la propagació/dispersió en una població, mentre que la covariància es considera una mesura de la variació de dues variables aleatòries o la força de la correlació.
• La variància es pot considerar com un cas especial de covariància.
• La variància i la covariància depenen de la magnitud dels valors de les dades i no es poden comparar; per tant, estan normalitzats. La covariància es normalitza en el coeficient de correlació (dividint pel producte de les desviacions estàndard de les dues variables aleatòries) i la variància es normalitza en la desviació estàndard (prenent l'arrel quadrada)