Entradas etiquetadas como ‘Mediana’

¡A la moda! Y a la mediana, y a la media…

–¿Nos vamos ya, Sal?

–Un segundo, Ven, me estoy atando las botas…

–Seguro que ya están todos esperando, date prisa, por fi.

–Ya ¿Pero qué haces con la camiseta al revés, Ven?

–No está al revés –respondió el pequeño sin inmutarse –.La etiqueta va por dentro…

–Pero ¡llevas el número en el pecho! –dijo Sal.

–Sí –respondió su hermano tajante.

–Ven, ¡ponte bien la camiseta, estás un poco ridículo! –exclamó el gafotas.

–No me importa, Sal –contestó Ven caminando hacia la puerta ufano –¡Soy un moderno! ¡Esta es la moda!

–Bueno, yo no estoy tan segura… –Mati acababa de llegar, Gauss respiró aliviado.

Mati20Blogs_41p

–¡Hola, Mati! –la saludó el gafotas –. A ver si tú lo puedes convencer…

–Hola, Mati –dijo el moderno –. Ya le he dicho al gafotas que esta es la moda…

–Ya, ya lo escuché –dijo la pelirroja –, y ya te dije que no estaba segura de ello. No creo que sea la forma más frecuente de llevar la camiseta, y en ese caso, no puede ser la moda.

Ven miró a Mati con el ceño fruncido pensando en alguna respuesta lo suficientemente moderna… pero no la encontró.

–La moda –les explicó Mati – es el valor que más se repite en un conjunto de valores o sucesos, por lo tanto, la moda de llevar la camiseta sería con el número en la espalda, que es como la lleva la mayoría de la gente, ¿no, Ven?

–No entiendo nada –se quejó el pequeño.

–Te estoy haciendo un poco de trampa –dijo ella –. Estoy mezclando el concepto de moda de un conjunto de datos en Estadística, con lo que comúnmente llamamos moda en la vida cotidiana, aunque eso sí, están relacionados.

–¿Qué es la moda de la Estadística, Mati? –preguntó inmediatamente el gafotas.

–La moda en Estadística –les contó –es una medida que se utiliza para obtener una primera aproximación de los valores representativos en un experimento, como lo son también la media o la mediana.

Los niños se quedaron muy serios, Gauss miró hacia la ventana disimulando.

–¿Os lo explico con un ejemplo? –les preguntó.

–¡Sí! –respondió Sal inmediatamente y se sentó en el suelo.

–Vale –aceptó el pequeño que estaba un poco despistado.

–A ver –empezó a decir ella –, supongamos que preguntamos el número de calzado que usan todos los niños de tu clase, Ven.

–Tercero A –dijo Ven – ¿Pueden estar también los de tercero B que está mi amigo Pablo?

–Por supuesto –dijo ella –, preguntamos el número de zapato a 40 niños y obtenemos las siguientes respuestas:

descriptiva_1

 

–Lo primero que tenemos que hacer –continuó la pelirroja –es ordenar estos datos para poder trabajar mejor con ellos. Para ello, hacemos una tabla donde ponemos cada uno de los valores obtenidos, cada número de zapato, y al lado el número de veces que ha aparecido en la encuesta, la frecuencia.

descriptiva_2

 

–Ya podemos saber cuál es la moda de este experimento –anunció Mati –, ¿cuál es el valor que más se repite, el que tiene mayor frecuencia?

–¡32! –gritó Ven de repente.

–Eso significa –añadió ella –que en tu clase la moda es tener un 32 de pie.

–Jo, pues yo no voy a la moda –se quejó el pequeño –porque tengo un 34…

–Bueno –lo consoló Mati –, 34 es un valor bastante frecuente también y cercano a la moda.

–¿Qué pasa si hay varios números de zapatos con la mayor frecuencia, Mati? –preguntó Sal.

–En ese caso –dijo la gafotas –, tendremos varias modas, no pasa nada. Nos quedan la mediana y la media para tratar de estimar el valor central del experimento.

–¿Cómo se calculan la mediana y la media? –preguntó Sal.

–La mediana –dijo ella –es el valor central de todos si los ordenamos de menor a mayor. Nos permite asegurar que es un valor mayor, o igual, que la mitad de los datos, el 50% de ellos, y menor o igual que el otro 50%. Si ordenamos nuestros datos de menor a mayor, como es un número par de datos. 40, tenemos dos valores centrales, en la posición 20 y 21. En ese caso, si hay dos valores centrales, los sumamos y dividimos el resultado por 2. En nuestro experimento, la mediana es 33: 

descriptiva_3

 

–Eso significa… –masculló el gafotas –que la mitad de los niños tienen un número menor o igual que 33 y la otra mitad, un número mayor o igual que 33, ¿no, Mati? 

–Efectivamente, Sal –confirmó esta –, nos da una información de la tendencia central que es, en ocasiones, más representativa que la media. 

–¿Cómo se calcula la media, Mati? –preguntó el gafotas. 

–Para calcular la media –dijo ella —multiplicamos cada dato por su frecuencia y sumamos todos. Luego dividimos el resultado por el número total de datos, en nuestra encuesta, 40:

descriptiva_4

 

 

–Mira –dijo Ven divertido –, se ha quedado en medio de la mediana y la moda, para que no se enfaden.

–Es cierto –dijo Mati –. Esto ha ocurrido porque nuestra distribución es muy homogénea, no hay datos muy alejados de los demás, ningún niño con un pie enorme o muy, muy pequeñito… Cuando la distribución de valores no es tan homogénea, conviene usar la mediana mejor que la media para dar una estimación central de los datos.

–Pero si salen muy parecidas, Mati… –dijo el gafotas.

–No, no siempre –respondió ella –. Imaginaos que le preguntamos a unos niños por el dinero que le dan en casa cada semana para sus cosas y obtenemos la siguientes respuestas:

descriptiva_5 

–¡Hala! –exclamó Ven –¡Qué suertudos los 2 últimos!

–Bueno, no sé, Ven –respondió Mati –, habrá que ver si además de una buena paga semanal tienen otras cosas más importantes pero… En fin, sigo: si calculamos la media, mediana y moda de esos datos, tenemos que:

descriptiva_6

–¡Toma. toma, toma! –dijo el pequeño Ven –Ahora sí que no se parecen…

–Ajá –asintió Mati –, esto ocurre porque la muestra de valores no es homogénea. A menudo, hay quien usa el valor de la media para dar una idea de lo habitual en la muestra, pero en este caso, si decimos que los niños suelen recibir 13 euros mensuales, estamos dando una información muy lejana de la realidad, puesto que 11 de los 13 niños, más del 84% de los encuestados, reciben menos de 7 euros…

–Es verdad… –interrumpió Sal.

–Usando la mediana y la moda –continuó la pelirroja –, afirmaríamos que la mitad de los niños reciben 6 euros o menos cada semana y que lo más frecuente es que reciban 5 euros semanales ¿No os parece que da una visión más real de los datos?

–¡Mucho más! –gritó el gafotas –¡Me gusta la mediana!

–A la mediana –añadió Mati sonriendo –se le llama también percentil 50. O segundo cuartil… Pero de este otro tipo de medidas y de otras formas de analizar nuestras muestras de datos hablaremos otro día, que os esperan en la cancha.

Hemos usado la media por encima de nuestras posibilidades

Últimamente estamos siendo bombardeados, con datos por ahora. Cifras de paro, de dinero que desaparece bajo la atenta mirada incluso de miembros de nuestra realeza o de nuestros mejores ex-ministros de Economía, impuestos que suben, sueldos que bajan, recortes en sanidad, educación, ciencia… No me río  más en estos días  porque no soy diputada del PP…

Pues bien, ante casi cualquier ocasión que se manejen datos, alguien acaba realizando la media aritmética de dichos datos para dar una información relevante acerca de ellos. Sin embargo, en muchas ocasiones, la media aritmética no es adecuada en absoluto. Voy a dar algunos ejemplos reales como la vida misma.

He asistido a varias reuniones en las que el director de una escuela técnica argumentaba que la carrera que en ella se impartía no era de tres años sino de ocho porque esa es la media de lo que tardaban los alumnos en terminarla. Al margen de que no acabo de entender por qué se tenía que vanagloriar de las dificultades que se encontraban los alumnos en su centro, nunca le he visto yo la gracia a este tipo de cosas, resulta que estaba utilizando la media para algo que no es relevante en absoluto. Se puede ver con un ejemplo muy simple (y algo simplista). Si 5 alumnos terminan sus estudios de esa carrera en 3, 4, 4, 4 y 20 años (este último igual los abandonó durante un tiempo o se dedicó a ellos con poco interés por las razones que sean), resulta que la media entre los 5 es de 7 años. Pero este dato es poco representativo ya que todos salvo uno terminaron sus estudios en 4 años o menos. En este caso, sería mucho más descriptivo (estamos hablando de una disciplina llamada Estadística Descriptiva)  utilizar la mediana (o percentil 50) que es el valor central de todos los valores que tenemos, con lo cual no influye nada que el que más tarde sea 10, 20 o 50 años. En nuestros ejemplo, la mediana, el valor que está en el centro si los ordenamos de menor a mayor,  es  4. Así, si la mediana en acabar una carrera es de cuatro años, esto significa que si entran cien alumnos a esa titulación, en cuatro años al menos cincuenta de ellos tendrán terminados sus estudios; por lo menos, todos los anteriores al valor central en esa lista en esa lista. Por ejemplo, si tenemos trece alumnos que tardaron, respectivamente, los años que aparecen en la lista siguiente ordenados de menor a mayor

3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 7, 20, 30

Si calculamos la media aritmética de los datos anteriores tendríamos que la media para finalizar estudios es de 7 años, mientras que la mediana, que sería el valor en la posición 7 (el central) es de 4 años. Creo que queda claro que la segunda medida es más descriptiva puesto que 10 de los estudiantes finalizaron sus estudios en 4 años o menos, ¿no?

El error anterior es porque se suele confundir media con valor central en muchas ocasiones, sin considerar cuántos elementos están por encima de la media (o cuántos por debajo). Por ejemplo, la media de piernas en la humanidad, el número de piernas por humano, es estrictamente inferior a 2. Por lo tanto, ¿podemos considerar una anomalía que todos los miembros de mi familia estén por encima de la media en número de piernas? Evidentemente no, es más, en este ejemplo se suele considerar como nada deseable estar por debajo de la media y absolutamente normal estar por encima de la media.

Pero existen otros malos usos de la media aritmética que son más preocupantes porque producen resultados totalmente erróneos. Un ejemplo muy simple sobre subida de precios: supongamos que en 3 años los precios de cierto producto han subido un 10%, un 20% y un 30% ¿Cuánto han subido en promedio? Todos entendemos que en promedio se refiere a qué mismo porcentaje tendría que haber subido cada año (cada año el mismo porcentaje) para obtener al cabo de los tres años el mismo precio. Obsérvese que para obtener el precio del primer año (tras una subida del 10%), tenemos que multiplicar por 1,1 el precio inicial. Al precio así obtenido tenemos que multiplicarlo por 1,2 (subida del 20%) para obtener el precio tras el segundo año. Y a dicho precio hemos de multiplicarlo por 1,3 (subida del 30%) para obtener el precio final. Así si el precio inicial es 100, el resultado final será:

100 x (1,1) x (1,2) x (1,3) = 171,6

Sin embargo, si consideramos la media aritmética de 10%, 20% y 30% (o de 1.1, 1.2 y 1.3) obtenemos un porcentaje del 20% (o multiplicar por 1.2), pero si aplicamos esa subida del 20% cada año, el resultado que obtenemos será:

100 x (1,2) x (1,2) x (1,2) = 172,8

Así que no tiene sentido proporcionar la media aritmética para calcular la subida anual promediada de los precios de un artículo. En este caso tendríamos que haber calculado la media geométrica de los tres números 1.1, 1.2 y 1,3 (la media geométrica de dos número es la raíz cuadrada del producto de dichos números, de tres números la raíz cúbica del producto, de cuatro números la raíz cuarta del producto y así sucesivamente). La raíz cúbica del producto de esos tres números es 1,19721577

Efectivamente si aplicamos cada año una subida del 19,721577 % obtenemos:

100 x (1,19721577) x (1,19721577) x (1,19721577) =171,6

que es el resultado correcto.

 

Espero haberos convencido de que la media no es siempre una medida representativa de los datos que estamos analizando. Hemos visto dos medidas que son mejores en según qué situaciones, la mediana o la media geométrica.

Siempre, claro está, que queramos ser fieles a la verdad y dar información lo más cercana posible a la realidad, porque lo creáis o no, hay gente que sigue tratando de manipularnos por encima de sus posibilidades…