Mitjana vs Mediana vs Mode
La mitjana, la mediana i la moda són les mesures principals de tendència central utilitzades en estadístiques descriptives. Són completament diferents entre si i els casos en què s'utilitzen per resumir les dades també són diferents.
Media
La mitjana aritmètica és la suma dels valors de dades dividida pel nombre de valors de dades, és a dir,
[làtex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Si les dades provenen d'un espai mostral, s'anomena mitjana mostral ([latex]\bar{x} [/latex]), que és una estadística descriptiva de la mostra. Tot i que és la mesura descriptiva més utilitzada per a una mostra, no és una estadística robusta. És molt sensible als valors atípics i oscil·lacions.
Per exemple, considereu els ingressos mitjans dels ciutadans d'una ciutat concreta. Com que tots els valors de les dades es sumen i després es divideixen, els ingressos d'una persona extremadament rica afecten significativament la mitjana. Per tant, els valors mitjans no sempre són una bona representació de les dades.
També, en el cas d'un senyal altern, el corrent que passa per un element varia periòdicament del sentit positiu al sentit negatiu i viceversa. Si prenem el corrent mitjà que passa per l'element en un sol període, donarà un 0, és a dir que no ha passat cap corrent per l'element, la qual cosa òbviament no és cert. Per tant, també en aquest cas, la mitjana aritmètica no és una bona mesura.
La mitjana aritmètica és un bon indicador quan les dades es distribueixen de manera uniforme. Per a una distribució normal, la mitjana és igual a la moda i la mediana. També té els residus més baixos quan es considera l'error quadrat mitjà; per tant, la millor mesura descriptiva quan cal representar un conjunt de dades amb un sol nombre.
Media
Els valors del punt de dades central després d'ordenar tots els valors de dades en ordre ascendent es defineixen com la mediana del conjunt de dades. La mediana és el 2n quartil, el 5è decil i el 50è percentil.
• Si el nombre d'observacions (punts de dades) és senar, la mediana és l'observació exactament al centre de la llista ordenada.
• Si el nombre d'observacions (punts de dades) és parell, aleshores la mediana és la mitjana de les dues observacions del mig de la llista ordenada.
Median divideix l'observació en dos grups; és a dir, un grup (50%) de valors superiors i un grup (50%) de valors inferiors a la mediana. Les mitjanes s'utilitzen específicament en distribucions esbiaixades i representen les dades força millor que la mitjana aritmètica.
Mode
Mode és el nombre que apareix més en un conjunt d'observacions. El mode d'un conjunt de dades es calcula trobant la freqüència de cada element del conjunt.
• Si no apareix cap valor més d'una vegada, el conjunt de dades no té cap mode.
• En cas contrari, qualsevol valor que es produeixi amb la freqüència més gran és un mode del conjunt de dades.
Poden existir més d'1 mode en un conjunt; per tant, el mode no és una estadística única d'un conjunt de dades. En una distribució uniforme, hi ha un mode. El mode d'una distribució de probabilitat discreta és el punt on la funció de massa de probabilitat arriba al seu punt més alt. A partir de les interpretacions anteriors, podem dir que els màxims globals són modes.
Considereu l'aplicació de les tres mesures al conjunt de dades següent.
DADES: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Mitjana=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Media=9 (13è element)
Mode=9 (freqüència de 9=5)
Quina diferència hi ha entre Mitjana, Mediana i Mode?
• La mitjana aritmètica és la suma dels valors (observacions) dividida pel nombre d'observacions. No és una estadística robusta i depèn molt de la naturalesa de la distribució normal dins de la distribució considerada. Un únic valor atípic pot provocar un canvi significatiu de la mitjana donant valors relativament enganyosos. El concepte es pot estendre a la mitjana geomètrica, la mitjana harmònica, la mitjana ponderada, etc.
• La mitjana són els valors mitjans del conjunt d'observacions i es veu relativament menys afectada pels valors atípics. Pot donar una bona estimació com a estadística de resum en casos molt esbiaixats.
• El mode és els valors d'observació més habituals del conjunt de dades. Si la distribució és sesgada positivament, el mode es troba a l'esquerra de la mediana i, si és negativa, el mode es troba a la dreta de la mediana.
• Si està sesgada positivament, la mitjana és correcta a la mediana; si la mitjana esbiaixada negativament es troba a l'esquerra de la mediana.
• A la distribució normal, les tres, la mitjana, la moda i la mediana són iguals.