domingo, 11 de julio de 2010

O ves el pártido o repasas probabilidad: ¿ Es Paul fruto de la psicología humana, o una mala pasada del azar?

Puede que no quede ningún ciudadano sin conocer a Paul, ( es imposible librarse del Mundial) ; pero si el fútbol no es santo de mi devoción al menos, aprovecharé el tirón mediático de Paul para enfatizar el papel predominante  ¿ predominante? de Las Matemáticas en la sociedad actual;  ya hubo un caballo matemático: Hans der Kluge en la Alemania de principios del siglo XX que era capaz de realizar operaciones aritméticas  ( sumar, multiplicar, dividir, trabajar con fracciones ,etc.) y otras tareas intelectuales  ( decir la hora, calcular el calendario, distinguir tonos musicales,... ) respondiendo pateando en el suelo.

En ambos casos cabe pensar en la influencia sobre ellos del experimentador.

Y los azares de la probabilidad: Paul pronostica dos resultados posibles (de victoria o derrota y no un empate), una probabilidad de 1/2 de predecir el primer juego correctamente, luego un 1/4 de probabilidad en la predicción de los dos primeros juegos, 1/8 de pronosticar correctamente  los tres primeros juegos, y así sucesivamente.
Esto quiere decir que las posibilidades de Paul de predecir correctamente los siete partidos, hasta la final, es de 1/128.
( Algunos habrán querido desear que después de tanto acierto éste se equivocará, es la Falacia del Jugador).

Habrá que preguntarle a su cuidador qué otros factores intervienen en estos aciertos.( Y digo acierto porque ha metido un gol Iniesta a falta de cuatro minutos de finalizar el partido)


Pero si es una Universidad, en este caso la de  de Nothwestern (Illinois, EE UU) la  que introduce un  algoritmo matemático que justifica la victoria de España la cosa cambia, ya creemos en " la fiabilidad" del mismo. Pues sí, España mereció ganar la semifinal. Jordi Duch, coautor del estudio y profesor asistente de matemáticas aplicadas y Ciencias de la Computación en la Universidad catalana Rovira i Virgili lo reduce a un estudio de La Teoría de Grafos.


 El equipo de investigadores del doctor Luís Amaral acaba de publicar los resultados de un estudio en el que se establecen medidas matemáticas para determinar con exactitud la contribución de cada jugador en su equipo. «Se han utilizado las técnicas de las redes sociales», explica Duch. El software utilizado establece una red en la que cada punto es un jugador y cada linea representa cuántas veces se pasan la pelota dos jugadores. Lo importante en este peculiar red es crear ocasiones de gol. De ahí, se obtiene el rendimiento matemático de los jugadores.


11 comentarios:

  1. Me alegro de que por fin alguien aborde este tema. En las web que tratan de explicar seriamente "el fenómeno" veo con extrañeza que no se llega a atinar con una buena explicación, siendo en mi opinión tremendamente sencilla.
    Veamos,

    La probabilidad de acertar todos los partidos es de 1/128.
    Y por otro lado tenemos varios cientos (miles) de "adivinos" animales en el mundo haciendo pronósticos. Cuando digo "animal" incluyo también a la especie conocida y autodenominada como "homo sapiens".
    Según lo anterior, cabe esperar que haya un cierto número de "adivinos" más o menos conocidos en sus localidades, con acierto pleno. Yo estimo este número en un rango de entre 5 a 50.

    Lo raro no es por tanto que haya un ente que haya "adivinado" todos los resultados del Mundial, lo raro es que no hayan aparecido más (ese número entre 5 y 50). ¿Y por qué no han salido a la luz más?. Pues porque no aportaría nada madiáticamente:

    - Aquí la Agencia Efe, diga
    - Tengo un ornitorrrinco que también lo adivina todo.
    - Muy bien, si acaso el pulpo Paul falla, nos pondremos en contacto con Vd.

    Me preguntaban ayer, dia del partido, ¿Que hubiera pasado si el pulpo hubiera dejado de acertar hace tres partidos?. Mi respuesta fue la siguiente:

    - Tras el primer fallo se hubiera minimizado la importancia del mismo con objeto de no tener que buscar otra estrella mediática.
    - Tras el segundo fallo o bien hubiera caído en el olvido o bien se hubiera empezado a buscar un nuevo candidato.


    Hay una especie de "pulpocentrismo" (equivalente al principio antrópico) según el cual no vemos la existencia de otros seres que simultaneamente están continuamente acertando y fallando pronósticos. No lo vemos porque aquello que no aparece en los medios es como si no existiera (desgraciadamente).

    Me parece que fue Adrian Paenza (no estoy seguro ahora) el que describe en algún libro como hacerse rico haciendo pronósticos de la Bolsa de Valores. El método si no recuerdo mal era dividir a nuetros "clientes objetivo" en 128 partes. A cada una de las cuales se le enviará el pronóstico de siete aciertos consecutivos (subida/bajada de bolsa). Mandando a cada uno de los grupos una combinación diferente, inevitablemente habrá un grupo en el que aciertes todos los pronósticos. Ese grupo te seguirá ciegamente ... como se sigue al pulpo Paul :-)

    ResponderEliminar
  2. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  3. bajá la probabilidad a 1/256, que también acertó la semifinal :-)

    ResponderEliminar
  4. Juan Pablo, no he seguido mucho al pulpo este, pero si hay que bajar a 1/256 lo bajamos; el razonamiento no varía demasiado :-)

    ResponderEliminar
  5. solo por curiosidad: ¿cuántos más debería adivinar para que varíe el razonamiento?

    En general, ¿a cuántos sigmas debería desviarse para empezar a considerar la evidencia como significativa de algo? Por supuesto, no hablo ya del pulpo, sino de un experimento cualquiera (relación tabaco-cancer, efectividad de una droga, mediciones de masas estelares, o cualquier otro que se te ocurra).

    ResponderEliminar
  6. Sobre el algoritmo de la Universidad de Nothwestern , decir que es muy interesante esta aplicación de teoría de grafos al fútbol. Si en lugar de generar el gráfico al final del partido se hiciera en tiempo real (cosa perfectamente posible), se podrían dar indicaciones muy útiles a los jugadores para optimizar su juego. De esta manera las matemáticas junto con el ordenador serían algo así como el jugador número doce. Puede que no tardemos mucho en verlo, quizás para el próximo mundial...

    Sobre el tema del pulpo, leo, no sin cierta alegría que alguien, en otro lugar de la red, ya comienza a dar una explicación muy parecida a la que expongo aquí. Al parecer, este sesgo tiene un nombre que se encuentra en la wikipedia inglesa y se llama "survivolship bias"

    Para ilustrar un ejemplo de survivolship bias (distinto al del pulpo y al que se expone en la wikipedia inglesa) traeré uno que tuve ocasión de presenciar y que me hizo gracia en su momento:

    Hace unos años en un foro especializado frecuentado por ingenieros, técnicos y científicos de distinto tipo, se comenzó a discutir sobre cierto test de CI que alguien había traido a colación. En principio el test estaba pensado para ser superado por muy poca gente (aprox el 5%), de manera que la sorpresa crecía cuando casi todos los miembros del foro coincidian en la relativa sencillez del mismo. Se concluyó que el test estaba mal hecho puesto que había sido superado por todos o casi todos. Finalmente alguien observó lo siguiente: ¿es la gente de este foro una muestra representativa de la sociedad?. Era un caso evidente de "survivolship bias". Y rizando el rizo, el "survivolship bias" era realmente doble pues posiblemente aquel que no sacó el test se mantuvo al margen de la discusión.

    ResponderEliminar
  7. Juan Pablo, no había visto tu comentario, disculpa... respondiendo a tu pregunta de la forma más directa posible diré que las respuestas basadas en contraste de hipótesis y similares, no me convencen. ¿por qué? Pues porque no responden bien a tú pregunta.Cuando se habla de un intervalo de confianza del 95% (que es el que se suele aplicar) ¿de qué se está hablando en realidad? Es una convención como otra cuaquiera. De lo contrario ¿por qué no un 99,9%? o un 99,999999% etc..

    En lugar de esto, y para el caso del pulpo, yo aplico otro criterio. Como puede leerse en mi primer comentario he estimado el número de adivinos con acierto pleno (como el pulpo Paul) en entre 5 y 50 en todo el mundo (Para una probailidad de 1/128). Si nos vamos a 1/256 (que al parecer es el correcto) el número de adivinos se reduciría a entre 2,5 y 25.

    Para 1/512 (9 aciertos) entre 1,25 y 12,5
    Para 1/1024 (10 aciertos) entre 0,625 y 6,25
    Para 1/2048 (11 aciertos) entre 0,313 y 3,125
    Para 1/4096 (12 aciertos) entre 0,156 y 1,563
    Para 1/8192 (13 aciertos) entre 0,078 y 0,782

    Como se ve para este último caso, mi previsión más optimista no alcanza ni a un solo adivino. Por tanto caso de acertar 13 partidos o más, mi teoría basada en la supervivencia sobre otros adivinos (survivolship bias) dejaría de tener sentido.

    En el caso hipotético de que eso ocurriera, y puesto que la hipótesis de la supervivencia ya no vale, habría que valorar lo siguiente: ¿qué es más probable que el pulpo sea adivino o que estemos siendo víctimas de un fraude? Habría que dar como correcta la que se considere más probable de las dos.

    Para otros casos como los que expones (tabaco/cáncer, etc... ) no hay otro remedio que basarse en la convención del "intervalo de confianza". Dicho intervalo es en realidad una probabilidad. Es decir, yo puedo decirte que hay un 95 % o un 99,9999999% de que cáncer y tabaco estén correlacionados. No puedo asegurarlo al 100%. De lo contrario no estariamos haciendo ciencia. La ciencia es modesta.

    ResponderEliminar
  8. NOTA: En el texto anterior uso deliberadamente la palabra "correlación" por simplificar, pero el intervalo de confianza lo que mide en realidad es la probabilidad de seguir una determinada distribución de probabilidad (por ejemplo una distribución normal).

    ResponderEliminar
  9. Aclaremos, por las dudas: no creo que el pulpo sea adivino!!!

    Ahora, por lo que decís, vos no creés en los test de hipótesis! Hay que aceptar que eso deja fuera demasiados papers de demasiadas ciencias, sólo los de matemáticas permanecen vigentes :-)

    Creo que cometés un ligero error (o una inconsistencia) cuando decís que sí aceptás los intervalos de confianza: son un caso particular de test, cuando querés comparar si dos valores son iguales o no. Lo interesante es que ese es el test aplicable a la hipótesis de que el pulpo acierta con probabilidad un medio!

    Que el resultado en el caso del pulpo esté a tres sigmas, es impresionante, no conozco muchos trabajos donde alcancen tales valores (una vuelta por PubMed te puede convencer rápido). O mejor: mirá la tabla de la normal, termina justo en el 3!

    Respecto al survivor bias, pues que está mal: no hubo veinte animales dando vueltas por los medios (con ese número el acierto vía la distribución del máximo pasa a ser razonable).

    Sí te acepto que en 2014 vamos a tener cientos de animalitos por todo el mundo que traten de 'predecir', y ahí el survivor bias va a funcionar

    ResponderEliminar
  10. Juan Pablo, el sesgo del survivol bias se basa precisamente en que aquellos que predicen y no aciertan son eliminados por los medios de comunicación. Y después de todos los que aciertan es evidente que a los medios solo le interesa elegir uno. Y por otro lado, ¿por qué han de ser animalillos? Podía ser perfectamente un mineral cambiando de color, una mancha en la pared cambiando de forma, o un adivino humano.

    En cuanto a los test de hipótesis, no es una cuestión de que yo crea o no crea en ellos. Es una herramienta muy muy útil, pero por su propia definición (y por lógica) no puede asegurar nada al 100%, sino dentro de un intervalo de confianza. Esto quiere decir que hay un margen en el que se puede escoger Ho como cierto y no serlo y lo mismo con H1. A veces se olvida esto y se afirma tajantemente que un hipótesis es o no es cierta. La cifras típicas del 95% o del 99% son una convención como otra cualquiera.

    ResponderEliminar
  11. No soy matemático, pero si entiendo la explicación estadística de los "aciertos" del pulpo, lo que no comprendo es la enorme difusión mediática del animalito ni la credulidad de la gente, aunque el mundial no ha sido espectacular en cuanto a juego, ha habido buenos partidos y buenos equipos, ¿era necesario meter a este bicho como algo excepcional o para-anormal? el aburrimiento mata.

    ResponderEliminar

Descubriendo a Emmy Noether de la mano de Eduardo Sáenz de Cabezón.

                Verano, es tiempo de aprender, y para ello hay que leer; empiezo un libro : "El árbol de Emmy. Emmy Noether, la mayor ...