Teoría de xogos (IX): Dous terzos da media (II)

[Esta é unha tradución autorizada de Ciención de Breogán, adaptada do artigo orixinal de 25 de outubro de 2010 Teoría de juegos IX – Dos tercios de la media (y II), de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, dispoñible aquí.]

[O artigo previo da serie é Teoría de xogos (VIII): Dous terzos da media (I).]

MísilesNa primeira parte do artigo propuxemos o xogo e agora imos ver os resultados e a súa solución teórica e a aproveitar esa discusión como escusa para presentar algúns conceptos máis.

Recapitulemos: tratábase de dicir un número que resultase ser dous terzos da media de todos os números ditos polos xogadores (incluído o noso).

Os números que se dixeron na versión orixinal deste artigo en El Cedazo foron: 1, 1, 1, 1, 1, 1, 2, 5, 7, 7, 9, 9, 10, 10, 12, 12, 13, 13, 14, 15, 16, 18, 18, 18, 18, 22, 22, 22, 22, 22, 22, 22, 25, 30, 32, 33, 33, 33, 33, 34, 35, 40, 42, 49, 55, 69, 87, 97 e 100. A media é 24,755 que, multiplicada por 23, é 16,503, arredondando a 17. Consecuentemente, os ganadores foron os que dixeron «16» e «18».1

Resultado teórico

O resultado teórico óptimo pode atoparse por unha sorte de «redución ao absurdo indutiva».

Supoñamos que todos os xogadores din o número máis alto posible: 100. A media sería 100 e dous terzos da media serían 67. Fíxate en que nunca pode saír un número meirande ca ese, así que sería inútil que os xogadores, que poden facer esta indución como fixemos nós, dixesen 100. Todos os números comprendidos entre o 68 e o 100 nunca poden saír. Logo por que van dicir, por exemplo, o 91?

Daquela, de facto o número máis alto que poden dicir é 67. Ninguén que fixese esta reflexión deberá dicir nada meirande ca 67. Moi ben, logo que todos digan o número máis alto posible: 67. Se calculamos dous terzos da media, sae 45. Hmmm… Se todos dixesen 67, que é o máis alto que de facto poden dicir, os dous terzos da media serían 45… Daquela, por que ía ninguén dicir, por exemplo, 55? O máximo que deberían dicir é 45.

Pero se din 45, entón resulta que os dous terzos da media son 30. Pero, se din 30, entón resulta que…

Podes imaxinar que podemos repetir isto tantas veces como queiramos ata chegarmos ao 1. Se todos din 1, dous terzos da media segue sendo 1, logo todos ganan.

Polo tanto, o único número que poden dicir é 1. Moitos dos nosos xogadores fixeron esta dedución e, en consecuencia, dixeron «1».

Resultado empírico

O caso é que, se repites este xogo con xogadores reais, buscando o que sae estatisticamente, raramente sae 1. E, como mostra, o caso que estamos a ver: non saíu 1, como pode verse no seguinte histograma.

Dous terzos da media

Está superposta a distribución gaussiana (con valores no eixe dereito), se ben non semella unha boa aproximación neste caso, co enorme pico do «1».

Houbo moitos xogadores que pensaron: «a media de 1 a 100… 50… dous terzos… 33!» Outros semella que pensaron: «Hm… moitos xogadores pensarán iso, así que eu vou dicir 23 de 33… 22!», é dicir, iniciaban a indución pero non a levaban ata o final.

O pico do «18» (que ademais ganou) supoño que se debe á xente que pensou o seguinte: «moitos dirán 33, e moitos outros dirán 22». Dous terzos da media deses dous valores é «18»: (2 / 3) × (22 + 33) / 2 = 18.

Algúns incluso dixeron números altísimos para os que non teño explicación. E unha cantidade non desprezable de xogadores foi cara aos arredores do 10–15, supoño que porque non contaba cos 2 ou 3 xogadores que dixeron números altísimos (durante uns días pareceume que ían ganar estes).

Eu confeso que non tentei ser un dos xogadores, nin sequera me preguntei que número diría eu.

Home irracional: emprégase o concepto de home irracional cando os xogadores non se comportan como di a teoría que deberían comportarse para maximizar a súa ganancia.

 

Non soamente é importante que nós sexamos racionais, escollendo a mellor opción ou non, senón tamén se o outro xogador é irracional ou non.

No noso exemplo dos dous terzos da media vimos que, se todos os xogadores fan a análise teórica perfecta, deben dicir «1». Pero que ocorre se algúns non fixeron esa análise ou se a fixeron mal? Podería ser que acabase ganando un deses irracionais, no canto do estudoso que coñece o problema perfectamente. Por iso diciamos que a este xogo podían xogar mesmo os que xa o coñecían previamente: porque non saben o que van dicir aqueles que non o coñecían. Por exemplo, os editores de El Cedazo xa coñecían un borrador desta segunda parte antes de xogar, e non por iso ganaron.

Nótese que aquí non empregamos o termo irracional como sinónimo de parvo. Pódese empregar este concepto para calquera xogador, sexa cal sexa a súa intelixencia, que non se decatase da estratexia óptima, non teña dispoñible a mesma información ca ti, ou calquera outra cousa. Por exemplo, probablemente algúns deses números tan altos do noso xogo foron de persoas que leron o enunciado ás présas e non entenderon o que se pedía.

Na terminoloxía típica dos xogos adoitan dicirse cousas como «baixo a hipótese de home racional […], pero baixo a hipótese de home irracional, daquela […]».

En vindeiros artigos, dedicarémoslle uns parágrafos de novo a este xogo, pero polo de pronto deixámolo aquí para abordarmos outros desde esta nova perspectiva.

O xogo do cempés, revisado

Botando a memoria cara atrás, probablemente lembremos o xogo do cempés. Alí viamos como a decisión óptima era repartir na primeira xogada,2 pero os resultados empíricos non acompañaban esta predición teórica. Se non lembras aquel artigo, repásao, porque seguiremos deducindo onde o deixaramos.

Aquí temos unha explicación desa aparente discrepancia: os xogadores daquelas probas empíricas non eran racionais, non facían a análise indutiva que fixemos nós e decidían repartir ou pasar empregando outros criterios. Enganándose, claro.

…Ou non?

Pois non, non se enganaban. Porque hai que escarvar máis. Podería semellar, lendo ata aquí, que se un xogador xogaba ao cempés e repartía na primeira quenda era racional, e se pasaba, era irracional… pois non tal.

Ana, que é racional, podería dicirse: «eu sei que debo repartir na primeira rolda, porque se non, Alberte repartirá na segunda, pero… sábeo el? É dicir, se cadra Alberte é irracional e non sabe que, cando lle chegue a quenda, debe repartir. Arríscome? Vale, arríscome».

Resumindo: se supón que Alberte é racional, debe repartir agora e quedar con 2 €.

Pero, se Alberte non é racional, Ana pode pasar, se cadra Alberte tamén pasa e Ana reparte na 3.ª quenda e queda con 4 €.

Fíxate niso: se Alberte é racional, a mellor opción de Ana é repartir xa. Pero, se Alberte é irracional, poida que a mellor opción sexa pasar (dependendo de cal sexa a súa irracionalidade, que non a coñecemos).

Así que Ana, mesmo sendo racional, pasa na primeira rolda.

Pero a graza está en que, na quenda de Alberte, el pode facer unha reflexión semellante: «Ana pasou porque é irracional? Ou pasou porque é racional pero confía en que eu sexa irracional? Ou, aínda máis, quizais ela sospeita que eu si son racional, pero cre que vou facer este mesmo razoamento e se cadra me arrisco unha quenda máis». Agora Alberte ten, con relación a Ana, a mesma disxuntiva que tiña Ana antes con relación a Alberte. De xeito que, outra vez, o feito de que Alberte sexa racional ou non, non significa necesariamente que vaia repartir. Nin tampouco o contrario.

Pero é que aínda hai máis. E se non é que sexa racional ou irracional, senón que é racional, pero finxe ser irracional para te obrigar a cambiar a estratexia?

É dicir, o feito de que Ana ou Alberte sexan racionais ou irracionais non nos garante que deban repartir ou pasar, e o feito de que un deles nun momento dado repartise ou pasase tampouco nos di nada sobre se eran racionais ou irracionais. Lembrade esta frase, porque é importantísima. Mesmo o comportamento que semella irracional pode ser racional se o miras con coidado.

Xa che doe a cabeza?

Aínda máis: se os xogadores racionais reparten sempre na primeira quenda, levan 2 €. Pero semella que os babecos que xogan nos experimentos empíricos (neste parágrafo si empregamos babeco nun senso pexorativo e provocativo) non reparten case nunca na primeira quenda, chegando de media, por exemplo, á quenda 40. Na quenda 40 o que repartiu quedou 41 € e o outro 39 €. Así que semella que incluso o perdedor dos babecos levou 39 € e o xogador racional quedou con 2 €… Quen é máis racional dos dous? Quen é máis babeco?

Teño que lembrar aquí a fábula do parvo da aldea. Todos os días os homes listos da aldea convocaban o parvo ao bar e dábanlle a escoller entre coller unha moeda de 1 € e outra de 0,50 €, fisicamente máis grande, e o parvo sempre escollía a de 0,50 €. Un día, un forasteiro que o viu chamou o parvo e contoulle que a de 1 € tiña máis valor, malia ser máis pequena. «Xa o sei, señor, non son tan parvo», respondeu o non-tan-parvo, «pero, se escollo a de 1 €, mañá xa non se volven rir de min e deixo de ganar os 50 céntimos».

Máis adiante na serie, veremos que incluso esta situación ten solución para o xogador racional, pero non é tan doada como criamos. Se liches con atención os parágrafos anteriores verías que dixemos «…de media…» e iso sérveche de pista para saberes por onde irán os tiros. Tamén te decatarías de que 2 + 0 é menos ca 1 + 3… outra das explicacións que tamén veremos.

De momento, quedemos co seguinte: a solución que criamos que era óptima pode non ser óptima se admitimos que pode haber xogadores que non sexan racionais (aínda que non esteamos seguros de se o noso opoñente o é ou non, ou simplemente el non está seguro de se o somos nós). E, se pode haber xogadores superracionais (veremos iso máis adiante), tampouco.

Por exemplo, moitos xogadores fixeron o mesmo razoamento teórico que fixemos aquí e dixeron «1», pero despois engadiron: «pero claro, non sei se os demais tamén razoarán isto… seica non debería dicir “1”». Logo non dicir «1» tamén pode ser moi racional. De feito, sei que moitos dos que non dixeron «1» foi exactamente por este motivo.

A sorte do novato

Isto vese claramente en xogos de cartas como o mus cando xogan novatos. Non imos explicar as regras do mus porque son complicadísimas e con moitas variantes locais (revisa a Wikipedia se non as coñeces, se ben incluso nela hai discrepancias con relación ás regras coas que xogo eu).

Cando xogan xogadores novatos (os que chamariamos irracionais na nosa terminoloxía) contra xogadores experimentados (racionais), a miúdo, e sorprendentemente, ganan os novatos. Isto chámase normalmente a sorte do novato e, se ben ás veces é certo que se debe á pura sorte no momento de recibir boas cartas, a maioría das veces débese máis ben ao problema que vimos: a mellor estratexia cando todos os xogadores son experimentados (racionais) pode non ser a mellor estratexia cando non sabemos se hai xogadores novatos (irracionais).

Exemplo: o xogador novato envida a chica e leva un tanto porquenó. Logo, a pares, o xogador novato bota órdago e o experimentado pensa: «Hm… que mamón… leva boas cartas, pero botou a chica para me enganar… Non podo querer a pares», porque é o que faría el… Pero non, o xogador novato botou órdago a pares con soamente dous pitos porque non sabe xogar. E como esa, outra morea de posibles xogadas. O xogador experimentado xoga coma se o opoñente tamén fose experimentado, e isto faille perder.

Exemplos semellantes deste aparente paradoxo poden atoparse xogando ao Texas hold ’em, ao tute, á escoba, a Magic: The Gathering e a centos doutros xogos.

A crise dos mísiles de Cuba

Coma tantas outras veces ao longo desta serie, imos buscar un caso real no que poidamos aplicar o que aprendemos.

Outubro de 1962. Cuba. A urss levou varias ducias de mísiles nucleares a Cuba e podería disparalos estando case todos os Estados Unidos ao seu alcance. A John F. Kennedy, o presidente dos eeuu naquela data, aquilo non lle gusta, porque cambia o equilibrio de forzas. Comeza un conflito e unha escalada de violencia.

No filme Thirteen days3 Roger Donaldson recrea aqueles momentos. Non garanto que o que describo a continuación sexa xustamente o que dicían os personaxes, porque falo de memoria, pero manteñen o esencial.

Os militares proponlle a Kennedy invadir Cuba. Cren que iso suporá que a urss invada Berlín. Os eeuu, nese caso, responderán apoiando os seus aliados consonte os plans establecidos (plans que inclúen armamento nuclear). E que fará entón a urss? Segundo o xeneral, non fará nada, porque o único que podería facer é lanzar un ataque nuclear masivo que os destruiría a ambos (e o resto da humanidade, de paso).

E se ese xeneral seguise adiante e os rusos fixesen a mesma dedución verbo dos americanos? É máis: fana (aínda que na película non nolo contan, debemos deducilo). Vexámolo.

Kennedy dille ao militar: «claro que farán algo, nós fariámolo se estivesen matando os nosos soldados. Non sei o que farán, pero non me diga que non van facer nada».

Así que Kennedy decide non invadir Cuba (ao menos polo momento) e iniciar un bloqueo. Os rusos saben que, se a urss non respecta o bloqueo e os eeuu afunden un barco soviético, a urss responderá, iniciarase a escalada de violencia e acabará nunha guerra nuclear masiva. Como a urss sabe que os eeuu non queren tal guerra, tamén sabe que non afundirán ningún barco soviético («como quedariamos se afundísemos un barco de gran?», di un dos personaxes nalgún momento). É dicir, fixeron o mesmo razoamento sobre os americanos que o xeneral fixera antes sobre os rusos. A conversa é algo como:

—Que farán os rusos agora?

—Que fariamos nós?

—Burlar o bloqueo.

—Burlarán o bloqueo.

Como vimos no xogo do cempés, a mellor decisión cando o opoñente é racional non ten de coincidir coa mellor decisión cando o opoñente é irracional ou non sabemos se o é ou el non sabe se nós o somos.

Modifiquemos lixeiramente o cempés. Agora pensemos que os montóns, no canto de ser moedas de 1 €, son millóns de mortos. Se interrompemos o xogo na quenda 1, teremos dous millóns. Se pasamos, teremos só un millón de mortos, pero o outro terá tres millóns. Pero se el tamén pasa, teremos nós catro millóns de mortos e el dous. E así sucesivamente, só que, neste perverso xogo do cempés modificado, non hai ninguén que o pare todo ao chegar á quenda 100…

Analizaremos este caso en vindeiros artigos da serie (se ben hai moitos outros no medio).

[O seguinte artigo da serie é Teoría de xogos (X): Xogo de confianza.]


Este artigo e mais a súa tradución están publicados baixo licenza CC BY-NC-ND 2.5 ES.


1. Ben, semella que quen dixo o 16 é «máis ganador» ca os demáis se ignoramos o arredondamento, pero tal e como describimos as regras, tanto 16 como 18 son ganadores.

2. Ben, repartir non repartiamos moito, porque eran 2 € para Ana e 0 € para Alberte… pero enténdese, non si?

3. Aínda non a viches? Xa che é hora!.

Advertisements

Deixar unha resposta

introduce os teu datos ou preme nunha das iconas:

Logotipo de WordPress.com

Estás a comentar desde a túa conta de WordPress.com. Sair /  Cambiar )

Google+ photo

Estás a comentar desde a túa conta de Google+. Sair /  Cambiar )

Twitter picture

Estás a comentar desde a túa conta de Twitter. Sair /  Cambiar )

Facebook photo

Estás a comentar desde a túa conta de Facebook. Sair /  Cambiar )

Conectando a %s