Diferència entre tendència central i dispersió

Diferència entre tendència central i dispersió
Diferència entre tendència central i dispersió

Vídeo: Diferència entre tendència central i dispersió

Vídeo: Diferència entre tendència central i dispersió
Vídeo: Лучший звук за свои деньги: обзор динамических наушников Tripowin x HBB Olina 2024, Desembre
Anonim

Tendència central vs dispersió

En l'estadística descriptiva i inferencial, s'utilitzen diversos índexs per descriure un conjunt de dades corresponent a la seva tendència central, dispersió i asimetria: les tres propietats més importants que determinen la forma relativa de la distribució d'un conjunt de dades.

Quina és la tendència central?

La tendència central fa referència i situa el centre de la distribució de valors. La mitjana, la moda i la mediana són els índexs més utilitzats per descriure la tendència central d'un conjunt de dades. Si un conjunt de dades és simètric, tant la mediana com la mitjana del conjunt de dades coincideixen entre si.

Donat un conjunt de dades, la mitjana es calcula sumant tots els valors de les dades i després dividint-la pel nombre de dades. Per exemple, el pes de 10 persones (en quilograms) es mesura com a 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Aleshores el pes mitjà de les deu persones (en quilograms) pot ser calculat de la següent manera. La suma dels pesos és 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Mitjana=(suma) / (nombre de dades)=710 / 10=71 (en quilograms). S'entén que els valors atípics (punts de dades que es desvien de la tendència normal) tendeixen a afectar la mitjana. Per tant, en presència de valors atípics, la mitjana sola no donarà una imatge correcta del centre del conjunt de dades.

La mediana és el punt de dades que es troba al centre exacte del conjunt de dades. Una manera de calcular la mediana és ordenar els punts de dades en ordre ascendent i, a continuació, localitzar el punt de dades al mig. Per exemple, si un cop ordenat, el conjunt de dades anterior té l'aspecte següent: 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Per tant, (70+72)/2=71 es troba al centre. A partir d'això, es veu que la mediana no ha d'estar al conjunt de dades. La mitjana no es veu afectada per la presència dels valors atípics. Per tant, la mediana servirà com a millor mesura de la tendència central en presència de valors atípics.

El mode és el valor que apareix amb més freqüència al conjunt de dades. A l'exemple anterior, el valor 70 i 72 apareixen dues vegades i, per tant, tots dos són modes. Això demostra que, en algunes distribucions, hi ha més d'un valor modal. Si només hi ha un mode, es diu que el conjunt de dades és unimodal; en aquest cas, el conjunt de dades és bimodal.

Què és la dispersió?

La dispersió és la quantitat de difusió de dades sobre el centre de la distribució. L'interval i la desviació estàndard són les mesures de dispersió més utilitzades.

L'interval és simplement el valor més alt menys el valor més baix. A l'exemple anterior, el valor més alt és 80 i el valor més baix és 62, de manera que l'interval és 80-62=18. Però l'interval no proporciona una imatge suficient sobre la dispersió.

Per calcular la desviació estàndard, primer es calculen les desviacions dels valors de les dades respecte a la mitjana. L'arrel quadrada mitjana de les desviacions s'anomena desviació estàndard. A l'exemple anterior, les respectives desviacions de la mitjana són (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 i (79 – 71)=8. La suma de quadrats de desviació és (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 La desviació estàndard és √(366/10)=6,05 (en quilograms). A menys que el conjunt de dades estigui molt esbiaixat, a partir d'això es pot concloure que la majoria de les dades es troben a l'interval 71±6,05, i és així en aquest exemple concret.

Quina diferència hi ha entre tendència central i dispersió?

• La tendència central fa referència i situa el centre de la distribució de valors

• La dispersió és la quantitat de difusió de dades sobre el centre d'un conjunt de dades.

Recomanat: