BLOGS

Hemos usado la media por encima de nuestras posibilidades

Últimamente estamos siendo bombardeados, con datos por ahora. Cifras de paro, de dinero que desaparece bajo la atenta mirada incluso de miembros de nuestra realeza o de nuestros mejores ex-ministros de Economía, impuestos que suben, sueldos que bajan, recortes en sanidad, educación, ciencia… No me río  más en estos días  porque no soy diputada del PP…

Pues bien, ante casi cualquier ocasión que se manejen datos, alguien acaba realizando la media aritmética de dichos datos para dar una información relevante acerca de ellos. Sin embargo, en muchas ocasiones, la media aritmética no es adecuada en absoluto. Voy a dar algunos ejemplos reales como la vida misma.

He asistido a varias reuniones en las que el director de una escuela técnica argumentaba que la carrera que en ella se impartía no era de tres años sino de ocho porque esa es la media de lo que tardaban los alumnos en terminarla. Al margen de que no acabo de entender por qué se tenía que vanagloriar de las dificultades que se encontraban los alumnos en su centro, nunca le he visto yo la gracia a este tipo de cosas, resulta que estaba utilizando la media para algo que no es relevante en absoluto. Se puede ver con un ejemplo muy simple (y algo simplista). Si 5 alumnos terminan sus estudios de esa carrera en 3, 4, 4, 4 y 20 años (este último igual los abandonó durante un tiempo o se dedicó a ellos con poco interés por las razones que sean), resulta que la media entre los 5 es de 7 años. Pero este dato es poco representativo ya que todos salvo uno terminaron sus estudios en 4 años o menos. En este caso, sería mucho más descriptivo (estamos hablando de una disciplina llamada Estadística Descriptiva)  utilizar la mediana (o percentil 50) que es el valor central de todos los valores que tenemos, con lo cual no influye nada que el que más tarde sea 10, 20 o 50 años. En nuestros ejemplo, la mediana, el valor que está en el centro si los ordenamos de menor a mayor,  es  4. Así, si la mediana en acabar una carrera es de cuatro años, esto significa que si entran cien alumnos a esa titulación, en cuatro años al menos cincuenta de ellos tendrán terminados sus estudios; por lo menos, todos los anteriores al valor central en esa lista en esa lista. Por ejemplo, si tenemos trece alumnos que tardaron, respectivamente, los años que aparecen en la lista siguiente ordenados de menor a mayor

3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 7, 20, 30

Si calculamos la media aritmética de los datos anteriores tendríamos que la media para finalizar estudios es de 7 años, mientras que la mediana, que sería el valor en la posición 7 (el central) es de 4 años. Creo que queda claro que la segunda medida es más descriptiva puesto que 10 de los estudiantes finalizaron sus estudios en 4 años o menos, ¿no?

El error anterior es porque se suele confundir media con valor central en muchas ocasiones, sin considerar cuántos elementos están por encima de la media (o cuántos por debajo). Por ejemplo, la media de piernas en la humanidad, el número de piernas por humano, es estrictamente inferior a 2. Por lo tanto, ¿podemos considerar una anomalía que todos los miembros de mi familia estén por encima de la media en número de piernas? Evidentemente no, es más, en este ejemplo se suele considerar como nada deseable estar por debajo de la media y absolutamente normal estar por encima de la media.

Pero existen otros malos usos de la media aritmética que son más preocupantes porque producen resultados totalmente erróneos. Un ejemplo muy simple sobre subida de precios: supongamos que en 3 años los precios de cierto producto han subido un 10%, un 20% y un 30% ¿Cuánto han subido en promedio? Todos entendemos que en promedio se refiere a qué mismo porcentaje tendría que haber subido cada año (cada año el mismo porcentaje) para obtener al cabo de los tres años el mismo precio. Obsérvese que para obtener el precio del primer año (tras una subida del 10%), tenemos que multiplicar por 1,1 el precio inicial. Al precio así obtenido tenemos que multiplicarlo por 1,2 (subida del 20%) para obtener el precio tras el segundo año. Y a dicho precio hemos de multiplicarlo por 1,3 (subida del 30%) para obtener el precio final. Así si el precio inicial es 100, el resultado final será:

100 x (1,1) x (1,2) x (1,3) = 171,6

Sin embargo, si consideramos la media aritmética de 10%, 20% y 30% (o de 1.1, 1.2 y 1.3) obtenemos un porcentaje del 20% (o multiplicar por 1.2), pero si aplicamos esa subida del 20% cada año, el resultado que obtenemos será:

100 x (1,2) x (1,2) x (1,2) = 172,8

Así que no tiene sentido proporcionar la media aritmética para calcular la subida anual promediada de los precios de un artículo. En este caso tendríamos que haber calculado la media geométrica de los tres números 1.1, 1.2 y 1,3 (la media geométrica de dos número es la raíz cuadrada del producto de dichos números, de tres números la raíz cúbica del producto, de cuatro números la raíz cuarta del producto y así sucesivamente). La raíz cúbica del producto de esos tres números es 1,19721577

Efectivamente si aplicamos cada año una subida del 19,721577 % obtenemos:

100 x (1,19721577) x (1,19721577) x (1,19721577) =171,6

que es el resultado correcto.

 

Espero haberos convencido de que la media no es siempre una medida representativa de los datos que estamos analizando. Hemos visto dos medidas que son mejores en según qué situaciones, la mediana o la media geométrica.

Siempre, claro está, que queramos ser fieles a la verdad y dar información lo más cercana posible a la realidad, porque lo creáis o no, hay gente que sigue tratando de manipularnos por encima de sus posibilidades…

Los comentarios están cerrados.