Más vale descartar lo bueno conocido…

Comprueben que sus cinturones están abrochados, su asiento en posición vertical y su mesita plegada porque ¡van a alucinar!

Al menos, yo alucino con este problema y espero que también os provoque turbulencias y alguna sonrisa de sorpresa 😉

Vamos a continuar con los concursos que tanta polémica crearon en nuestra entrada sobre Monty Hall y vamos a presentar un concurso parecido (de hecho es parte del mismo proceso que se llevaba a cabo en Un, dos, tres).

Estamos en un concurso. Se nos presentan un cierto número de cajas, N, y podemos abrirlas en el orden que nos plazca. Cada caja contiene una cantidad de dinero distinta de las otras (no sabemos qué cantidades hay en cada una, ni cuáles son esas cantidades). Cada vez que abrimos una caja decidimos (después de contar el dinero en ella, se entiende) si nos quedamos con ella (esa es la caja que escogemos) o si la descartamos para siempre (una vez que una caja ha sido descartada, ya no podemos volver a ella). Tratamos de diseñar una estrategia que nos garantice escoger la mejor caja (la que tiene más dinero) el mayor número de veces posible

¿A qué parece que no se va a ser posible? ¡Ja!

Para simplificar supongamos que tenemos 3 cajas: A, B y C. Abrimos la primera (la A), como no tenemos ni idea de qué cantidades hay en cada caja, en A puede estar el mayor botín o no, no tenemos ninguna información adicional, por lo tanto, si escogemos A, nuestro posibilidades de acertar con el premio máximo es de .

¿Podemos mejorar dicha estrategia?¿Podemos diseñar otra estrategia que garantice siempre más de ⅓ de posibilidades de obtener la máxima cantidad?

Os propongo una: abrimos la primera caja (la A) y contamos el dinero que hay, pero la descartamos independientemente de cuánto dinero encierre. Ahora abrimos la segunda caja (la B), si contiene más dinero que la primera, nos quedamos con la segunda, en caso contrario nos quedamos con la tercera ¿En cuántos casos hemos acertado con esta estrategia?

Realicemos un examen viendo todas las posibilidades distintas.

En cada caso, escribiremos las tres cajas ordenadas por la cantidad de dinero que tienen de mayor a menor.

El primer caso lo escribimos como (A, B,C) (esto es, la caja A tiene más dinero, después la B, después la C). Vamos a suponer que las 3 cantidades son, respectivamente, 100, 50 y 25, pero, claro, eso no lo sabe el concursante a priori, no sabe cuál es el premio máximo, ¿me explico? Pero lo pensamos así para hacer una simulación de los 6 casos posibles con 3 cajas.

Siguiendo la estrategia descrita, abrimos la A, la descartamos, abrimos la B y como tiene menos que la A, escogemos la C, que es la que menos dinero tiene: mal empezamos. Nos hemos quedado con el peor premio…

(He hecho unas figuras para cada simulación, en otro color pongo la caja que escogeríamos con esta estrategia. Si el color es verde, es que hemos ganado. Es que soy del Betis…)

Veamos, entonces, apoyándonos en las figuras, qué caja escogeríamos, en cada caso,  siguiendo nuestra estrategia.

Para (A,B,C) escogemos C y hemos perdido, es la que acabamos de analizar unas líneas más arriba.

Para (A,C,B) escogemos C, y perdemos.

 

 

Para (B,A,C), abrimos la A, la descartamos, abrimos la B que tiene más dinero y nos quedamos con ella y hemos ganado (¡por fín!).

Para (B,C,A) escogemos la B y ganamos (¡ole con ole!)

 

 

Con (C,A,B) escogemos C y ganamos, (¡toma, toma, toma!)

 

 

Y para (C,B,A) escogemos B y perdemos.

 

Como vemos, con la estrategia anterior podemos garantizar un éxito del 50% (ganamos 3 de 6), lo cual es mejor que el 33% (=1/3) que teníamos si escogemos una caja al azar. Anda, ¡mira!

Lo curioso es que esta estrategia se puede aplicar a cualquier número de cajas, por sorprendente que parezca y aunque no se conseguirá siempre un éxito del 50%, sí que podemos obtener un porcentaje sorprendentemente alto (mayor de ⅓ independientemente del número de cajas). Sí, sí, éxito con una probabilidad casi del 37%, sea cual sea el número de cajas.

Allá vamos, ¡digo!

Se puede probar que el método que nos garantiza mejor resultado es el siguiente: Si tenemos que escoger entre N cajas, abrimos unas cuantas (digamos r) y las descartamos, pero anotamos de esas r cajas cuánto dinero tenía la que más tenía. A continuación seguimos abriendo las cajas restantes y nos quedamos con la primera que tenga más dinero que el que habíamos anotado como el máximo de las r primeras.

Si ninguna tiene más dinero obviamente nos quedamos con la última. Solo queda por determinar cuánto vale r, es decir, ¿cuántas cajas tenemos que abrir y descartar inicialmente?

Hemos visto que en el caso de 3 cajas (N=3, 3 cajas) r es 1. Se puede comprobar que en el caso de N=4 (cuatro cajas) r también vale 1 (miramos la primera, la descartamos, y después vamos abriendo las restantes y nos plantamos si una tiene más dinero que la inicial, con esta técnica en el caso de 4 cajas podemos garantizar que escogeremos la mejor en un 46% de los casos).

En la siguiente tabla se muestra cuántas cajas tenemos que desestimar dependiendo del número de cajas que tengamos en total para asegurar la mayor probabilidad de éxito (se puede comprobar haciendo algunas cuentas, bastantes):

 

¿Y si son más de 9 cajas? Se puede aplicar la misma técnica, pero ¿cómo calculamos el número de cajas r que tenemos que  desestimar? Desconecten sus teléfonos móviles y agárrense…

Hay una regla más o menos sencilla: el número r de cajas a desestimar es el número entero más próximo a N/e donde e es el número de Euler que es aproximadamente igual a 2,71828182845905 (no es un número racional y por tanto tiene infinitas cifras decimales que no se repiten de forma periódica).

Sí, yo también me quedé con esa cara cuando lo leí… es normal… ¿¿El número e??

Pues sí, desechando ese número de cajas, podemos asegurar que siempre obtendremos un éxito de al menos 1/e de los casos: un 36,8%, por muy grande que sea el número de cajas. La tabla anterior añadiendo una fila con los valores obtenidos al dividir el número de cajas entre e, quedaría:

Por ejemplo, para 10000 cajas, N=10000, tendríamos 10000/e= 3678,794411714, descartamos las 3679 (éste es el número entero más próximo a 3678,794411714) primeras cajas, y nos quedamos con la primera de las restantes que supere en dinero a todas las 3879 descartadas inicialmente y … ¡Tachán! La probabilidad de éxito es del 37%…

Por Euler, ¿¿no es maravilloso y sorprendente??

Ay… una se pregunta, ¿a cuántos incompetentes tendríamos que desechar para quedarnos con alguien que sepa arreglar este país con una probabilidad de éxito tan alta? En fin…

Este problema se conoce como el Problema de la secretaria, el Problema de la dote del Sultán, del Pretendiente exigente y no sé si algún otro nombre más. Podéis conocer más si queréis aquí y aquí.

 

13 comentarios

  1. Dice ser asdf

    vaya patuchada no??

    22 octubre 2012 | 17:17

  2. Dice ser La chinchorra

    Fascinante. Gracias por el problema tan interesante. Por fín algo que nos hace usar la cabeza.

    22 octubre 2012 | 17:34

  3. Dice ser Gael

    Es una variante de un problema basico de estadistica (http://en.wikipedia.org/wiki/Monty_Hall_problem). Es anecdotico porque la estrategia optima va en contra de la intuicion pero no supone ningun reto para cualquiera que haya asistido a la primera clase de un curso introductorio.

    22 octubre 2012 | 17:59

  4. Dice ser Alex T.

    Gael, el Monty Hall se basa en la existencia de un agente externo que actúa de forma no aleatoria, el presentador que abre una puerta sabiendo lo que hay detrás y bajo un criterio preestablecido.
    No es lo mismo que este caso. Se parecen en que ambos son problemas estadísticos, pero ni el planteamiento ni la solución tienen nada que ver.

    22 octubre 2012 | 18:37

  5. Dice ser José

    Muy interesante. Os animo a seguir proponiendo problemas de este estilo. Incluso se pueden proponer problemas similares a los lectores.

    22 octubre 2012 | 19:13

  6. Dice ser Norby

    Las cajas están mal, todas deberían ser A=100, B=50 y C= 25

    22 octubre 2012 | 22:50

  7. Dice ser Belit

    Por estadístico que sea, desconociendo las cantidades es ABSURDO utilizar una estrategia: es cuestión de pura y dura suerte. Con mil estrategias que queramos hacer, todo depende de qué caja abramos en primer lugar, y de qué cantidad tenga dicha caja. En otras cosas no dudo que la estadística puede ser una gran ayuda a tener en cuenta, pero en cuestión de AZAR es ABSURDO. Todo tiene un análisis científico, todo tiene un análisis que podemos formular de forma estadística, pero eso no sirve de nada con el simple azar: ¿acaso teniendo tres cajas con tres cantidades y sin tener en absoluto ningún conocimiento de las cantidades sirve de algo la estadística? ¿Acaso la estadística determina que la cantidad mayor estará siempre en A? Es ABSURDO.

    22 octubre 2012 | 23:19

  8. Dice ser Tonika

    Si se descarta una caja hay que contemplar las dos elecciones restantes, las cajas B y C en cada uno de los casos posibles, en los dos últimos casos esto se hace bien. Si en C está el premio y se eligen B y C, hay un acierto del 50%, esto supone un caso de premio y otro sin él.
    Esta misma lógica no se aplica en el resto de los casos 1 al 4 ya que se elige siempre la misma caja dos veces, lo cual en el primer caso no influye en el resultado, ya que al estar descartada la caja ganadora y por lo tanto nunca se acierta.
    Si que se muestra un resultado erróneo en los casos 3 y 4, ya que deberían ser idénticos al 5 y 6, al haber dos cajas y tener una ellas el premio, cuando se escoge una, se tendrá un posibilidad del 50% de acierto, lo que también supone un caso de premio y otro sin él.

    En total, descartando una caja, se da en 2 de 6 casos posibles el premio, es decir un 1/3. ¿He ganado una galleta o algo? .)

    Saludos.

    22 octubre 2012 | 23:27

  9. Dice ser Norby

    Belit, la estadística no te asegura ganar, puedes llevarte incluso el peor premio como en el primer ejemplo, pero sí aumenta tus probabilidades

    22 octubre 2012 | 23:33

  10. Dice ser matifutbol

    Excelente artículo. Muy bien explicado. Aunque aún les quepa la duda a algunos, porque se trata de una paradoja que es poco evidente.
    Mi aportación al mismo tema la podéis encontrar en:
    http://www.matifutbol.com/docs/temas/suplente.html
    (Y que conste que la publiqué antes de que Falcao se pusiese de moda)
    Enhorabuena por el blog!

    22 octubre 2012 | 23:51

  11. Dice ser Mik

    Sin las cantidades, cualquier caja que eliges es ganadora y perdedora al mismo tiempo. Lo correcto para este problema seria escoger una y quedarte con ella. Es parecido al problema que dice; «hay una habitación llena de cajas, cada caja tiene 100 €, pero una te mata. Cuantas cajas cogerías?»

    23 octubre 2012 | 0:24

  12. Dice ser Sicoloco del castin de Foolyou

    No me caben en la cabeza todos esos datos.

    23 octubre 2012 | 0:40

  13. Dice ser Sid

    Me parece que hay un error (aunque no me quiero adelantar y espero sus comentarios)…
    El problema planteado habla de obtener la mayor cantidad de dinero ofrecido; por así decirlo. Si mantenemos el orden de los premios en las cajas, es decir, en A=100, B=50, y C=25; la probabilidad de obtener el premio mayor es de 1/3 siempre que descartemos la primera elección y nos quedemos con la segunda, dadas las permutaciones que nos dan los tres elementos; por otra parte, si lo que deseamos es obtener un premio mayor al anterior con la premisa de descartar siempre la primera caja elegida, la probabilidad de obtener un premio mejor al anterior es efectivamente de un 50% como está establecido Mati…

    Excelente blog, lo encontré hace poco y me parecen muy interesantes sus artículos…
    Saludos desde México.

    15 noviembre 2012 | 7:56

Los comentarios están cerrados.