Authors: Nassim Nicholas Taleb
Supongamos que apunto al lector a una apuesta (legal) donde las probabilidades no están ni a su favor ni en su contra. Tiramos una moneda al aire. Si sale cara, gana un dólar; si sale cruz, pierde un dólar.
Figura 8. El quincux (simplificado): una máquina flipper. Soltemos las bolas de forma que, con cada goípe, caigan aleatoriamente a la derecha o a la izquierda. El resultado que la figura representa es el más probable, y se parece mucho a la curva de campana (también llamado distribución gaussiana). Cortesia de Alexander Taíeb.
Después del primer lanzamiento, ganará o perderá.
En el segundo lanzamiento, el número de posibles resultados se duplica. Caso uno: ganar, ganar. Caso dos: ganar, perder. Caso tres: perder, ganar. Caso cuatro: perder, perder. Cada uno de estos casos tiene unas probabilidades equivalentes; la combinación de una única ganancia y una única pérdida tiene una incidencia dos veces mayor porque los casos dos y tres, ganar-perder y perder-ganar, conllevan el mismo resultado. Y ahí está la clave de lo gaussiano. Buena parte del centro desaparece, y ya veremos que hay mucho en el centro. De modo que, si jugamos por un dólar la ronda, después de dos rondas tendremos un 25 % de probabilidades de ganar o perder dos dólares, pero un 50% de no tener ni pérdidas ni ganancias.
Hagamos otra ronda. El tercer lanzamiento dobla de nuevo el número de casos, de manera que nos enfrentamos a ocho posibles resultados. El caso 1 (que en el segundo lanzamiento era ganar, ganar) se diversifica en ganar, ganar, ganar y ganar, ganar, perder. Hemos añadido un ganar o perder al final de cada uno de los resultados anteriores. El caso 2 se diversifica en ganar, perder, ganar y ganar, perder, perder. El caso 3 se diversifica en perder, ganar, ganar y perder, ganar, perder. El caso 4 se diversifica en perder, perder, ganar y perder, perder, perder.
Tenemos ahora ocho casos, todos igualmente probables. Observemos que de nuevo podemos agrupar los resultados regulares en los que una ganancia elimina una pérdida. (En el quincunx de Galton, dominan las situaciones en que la bola cae a la izquierda y luego a la derecha, o viceversa, de modo que uno acaba con muchas en el centro.) El total, o lo acumulado, es como sigue: 1) tres ganancias; 2) dos ganancias, una pérdida; total, una ganancia; 3) dos ganancias, una pérdida; total, una ganancia; 4) una ganancia, dos pérdidas, total, una pérdida; 5) dos ganancias, una pérdida; total, una ganancia; 6) dos pérdidas, una ganancia; total, una pérdida; 7) dos pérdidas, una ganancia; total, una pérdida; y, por último, 8) tres pérdidas.
De entre los ocho casos, el de tres ganancias se produce una vez. El de tres pérdidas, una vez. El de una pérdida en total (una ganancia, dos pérdidas), tres veces. El de una ganancia en total (una pérdida, dos ganancias), tres veces.
Juguemos otra ronda, la cuarta. Habrá dieciséis resultados igualmente probables. Tendremos un caso de cuatro ganancias, un caso de cuatro pérdidas, cuatro casos de dos ganancias, cuatro casos de dos pérdidas, y seis casos de ni pérdidas ni ganancias.
El quincunx (el nombre procede de la palabra latina que significa cinco) del ejemplo del flipper muestra la quinta ronda, con sesenta y cuatro posibilidades, todas ellas fáciles de calcular. Esta era la idea que se ocultaba en el quincunx que empleaba Francis Galton. Galton pecaba tanto de ser poco perezoso como de ser un tanto ajeno a las matemáticas; en vez de construir el artilugio, podría haber trabajado con un álgebra más sencilla, o quizás haber emprendido un experimento de pensamiento como éste.
Sigamos jugando. Continuemos hasta llegar a cuarenta rondas. Se pueden realizar en pocos minutos, pero necesitaremos una calculadora para averiguar el número de resultados, que ponen a prueba nuestro sencillo experimento de pensamiento. Tendremos unas 1.099.511.627.776 combinaciones posibles, más de un billón. No nos molestemos en hacer el cálculo a mano, es dos multiplicado por sí mismo cuarenta veces, ya que cada rama se duplica en cada coyuntura. (Recordemos que añadimos una ganancia y una pérdida al final de las alternativas de la tercera ronda para pasar ala cuarta, doblando así el número de alternativas.) De estas combinaciones, sólo una llegará al punto más alto de cuarenta, y sólo una al más bajo de cuarenta. El resto se situará por el medio, en este caso cero.
Podemos observar ya que en este tipo de aleatoriedad los extremos son sumamente raros. Una probabilidad de entre las 1.099.511.627.776 posibles es obtener el mismo resultado en cuarenta lanzamientos. Si realizamos el ejercicio de cuarenta lanzamientos, uno por hora, las probabilidades de conseguir alcanzar el extremo de 40 resultados idénticos seguidos son tan pocas que serían necesarios muchos intentos de cuarenta lanzamientos para verlo. Suponiendo que nos tomamos algún descanso para comer, hablar con los amigos y compaNeros de habitación, tomarnos una cerveza y dormir, podemos esperar que un resultado de llegar al extremo de 40 (en uno u otro sentido) nos costara cuatro millones de vidas de lo que suele ser una existencia media. Y consideremos lo siguiente. Supongamos que jugamos una ronda más, hasta un total de 41; sacar 41 caras supondría ocho millones de vidas. Pasar de 40 a 41 reduce a la mitad las probabilidades. Este es un atributo clave del esquema no escalable que analiza la aleatoriedad: las desviaciones típicas disminuyen a un ritmo creciente. Sacar 50 caras seguidas supondría cuatro mil millones de vidas .
Figura 9.
Número de lanzamientos con
ganancia. Resultado de cuarenta lanzamientos. Vemos cómo emerge la protocampana.
No estamos aún plenamente en una campana de Gauss, pero nos acercamos a ella peligrosamente. Estamos aún en lo protogaussiano, pero ya podemos ver lo esencial. (En realidad, nunca encontraremos una campana gaussiana pura ya que es una forma platónica; nos acercamos un poco más pero no podemos alcanzarla.) Sin embargo, como podemos ver en la figura 9, empieza a emerger la conocida forma de campana.
¿Cómo podremos acercarnos aún más a la campana de Gauss perfecta? Puliendo el proceso de lanzamiento. Podemos lanzar 40 veces a 1 dólar el lanzamiento, o 4.000 veces a 10 centavos el lanzamiento, y sumar los resultados. El riesgo esperado es más o menos el mismo en ambas situaciones, lo cual constituye una trampa. En la diferencia entre los dos conjuntos de lanzamientos se intuye un pequeño problema. Multiplicamos el número de apuestas por 100, pero dividimos el tamaño de la apuesta por 10; no busquemos ahora una razón, simplemente supongamos que son «equivalentes». El riesgo total es equivalente, pero ahora hemos abierto la posibilidad de ganar o perder 400 veces seguidas. Las probabilidades son de un 1 seguido de 120 ceros, es decir de una entre 1.000.000.000.000.000.000.000.000.000.000.000.000.000.000. 000.000.000.000.000.000.000.000. 000. 000. 000. 000. 000. 000. 000.000.000.000.000.000.000.000.000.000.000.000.
Sigamos un poco más el proceso. Pasamos de 40 lanzamientos a 1 dólar cada uno a 4.000 lanzamientos a 10 centavos, a 400.000 lanzamientos a 1 centavo, acercándonos cada vez más a una campana gaussiana. La figura 10 muestra los resultados, que van de -40 a 40, concre tamente ochenta puntos marcados. El siguiente paso será llegar a los 8.000 puntos.
Sigamos. Podemos tirar 4.000 veces apostando la décima parte de 1 centavo. ¿Qué tal 400.000 veces al/1.000 de centavo? Como forma platónica, la curva gaussiana pura es principalmente lo que ocurre cuando tenemos una infinidad de lanzamientos por ronda, con apuestas infinitesimalmente pequeñas. No nos preocupemos de visualizar los resultados, ni siquiera de entenderlos. Ya no podemos seguir hablando de un tamaño «infinitesimal» de la apuesta (pues tenemos una infinidad de éstas, y estamos en lo que los matemáticos llaman un esquema continuo). La buena noticia es que existe un sustituto.
Hemos pasado de una apuesta sencilla a algo completamente abstracto. Nos hemos ido de las observaciones al reino de las matemáticas. En matemáticas, las cosas llevan en sí una pureza .
Ahora bien, se supone que no existe algo completamente abstracto, por lo tanto, por favor, no intentemos ni siquiera hacer el esfuerzo de comprender la figura 10. Basta con que seamos conscientes de su uso. Imaginémoslo como un termómetro: no se supone que, para poder hablar de la temperatura, debamos entender qué significa. Sólo necesitamos conocer la correspondencia que hay entre la temperatura y la comodidad (o alguna otra consideración empírica). Veintidós grados corresponde a un tiempo bueno; veinte bajo cero no es algo que pueda encantar a alguien. No tenemos por qué preocuparnos de la velocidad real de las colisiones entre las partículas, que es lo que explica la temperatura de forma más técnica. Los grados son, en cierto sentido, un medio con el que nuestra mente traduce a cifras ciertos fenómenos externos. Asimismo, la campana de Gauss está planteada de tal manera que el 68,2 % de las observaciones se sitúan entre las desviaciones típicas de -1 y +1 respecto a la media. Repito: no intentemos siquiera comprender sí la desviación típica es una desviación media; no lo es, pero mucha gente (demasiada) que emplea la expresión desviación típica no entiende este punto. La desviación típica no es más que un número conforme al cual equilibramos las cosas, una cuestión de mera correspondencia si los fenómenos fueran gaussianos. A estas desviaciones típicas a menudo se las denomina «sigma». También se habla de «varianza» (es lo mismo: la varianza es el cuadrado de sigma, es decir, de la desviación típica).
Observemos la simetría de la curva. Obtenemos los mismos resultados tanto si sigma es positiva como si es negativa. Las probabilidades de caer a -A sigmas son las mismas que las de superar 4 sigmas, en este caso 1 entre 32.000 veces.
Como puede ver el lector, el aspecto principal de la campana de Gauss es, como he estado diciendo, que la mayor parte de las observaciones se sitúan en torno a lo mediocre, la media, mientras que las probabilidades de una desviación disminuyen de forma cada vez más rápida (exponencialmente) a medida que nos alejamos de la media. Si debemos retener algo en la memoria, recordemos esta drástica disminución de velocidad en las probabilidades a medida que nos apartamos del promedio. Las rarezas son cada vez más improbables. Podemos ignorarlas con toda seguridad.
Esta propiedad también genera la ley suprema de Mediocristán: dada la escasez de grandes desviaciones, su aportación al total será evanescentemente pequeña.