Teoría de xogos (XVIII): Escándalo de corrupción

[Esta é unha tradución autorizada de Ciención de Breogán, adaptada do artigo orixinal de 10 de xaneiro de 2011 Teoría de juegos XVIII – Escándalo de corrupción, de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, dispoñible aquí.]

[O artigo previo da serie é Teoría de xogos (XVII): A caza do cervo.]

Hoxe empregaremos novas de actualidade para seguir avanzando na nosa serie de Teoría de xogos: un escándalo de corrupción.1 Veremos como se enfrontan a un escándalo de corrupción dous partidos políticos e como escollen a súa mellor acción utilizando a teoría de xogos.

Concello de Hamburgo

Aproveitaremos o xogo para presentar un par de conceptos novos, Maximin e Minimax, e veremos como estivemos empregándoos de xeito implícito ao longo da serie.

A situación é a seguinte: sorprendentemente, a un alcalde electo collérono aceptando subornos dun contratista (non sei se o sorprendente é que os aceptase ou que o collesen; que cada quen escolla). O asunto aínda non se fixo público, pero tanto o partido no poder (o Partido Laranxa ou PL) como a oposición (o Partido Amarelo ou PA) xa o coñecen e poden escoller entre tres opcións:

  • Condenar o asunto enerxicamente.
  • Ficar Calados, nin confirman nin desmenten.
  • Defender a actuación do alcalde.

Ademais, as eleccións están moi cerquiña, así que a posición que tome cada partido ante este asunto pode ser determinante. Nós tomaremos a posición do Partido Laranxa.

Loxicamente, cada acción vai supor diferentes réditos electorais. O Partido Laranxa fixo un estudo baseado en enquisas aos cidadáns e na súa propia experiencia e chegou á seguinte matriz de pagamentos:

PA
Condenar Calar Defender
PL Condenar 45 40 50
Calar 25 50 60
Defender 50 15 70

Na matriz pomos a porcentaxe de votos que acadaría o Partido Laranxa nas vindeiras eleccións, mentres o Partido Amarelo conseguirá os que falten ata o 100 % (consideramos que as abstencións, votos en branco e votos a outros partidos xa foron eliminados da análise). Así, se o Partido Laranxa obtén o 40 % dos votos, o Partido Amarelo obterá o 60 % e gobernarán os Amarelos.

Nótese que esta é a matriz de pagamentos que coñece o Partido Laranxa. O Partido Amarelo puido facer outras enquisas diferentes e ter outra experiencia e crer que a matriz de pagamentos é outra distinta, e mesmo poida que a súa sexa a correcta. Tanto nos ten: nós decidiremos consonte o que sabemos (ou cremos saber) e non faremos suposicións sobre os datos que manexan eles.

Cal é a mellor estratexia para o Partido Laranxa?

Estratexia Maximin

Estratexia Maximin: consiste en escoller a opción que nos dea a máxima recompensa das mínimas posibles consecuencia das posibles escollas do opoñente.

 

Coma case sempre, é un pouco complicado de entender, pero vese mellor ao estudármolo sobre o noso exemplo.

Se nós somos o Partido Laranxa e queremos escoller segundo unha estratexia Maximin, debemos comezar supondo que xa fixemos a escolla e póndonos no peor dos casos para a escolla do contrario.

Deste xeito, se nós decidimos Condenar, o peor para nós é que o Partido Amarelo escolla Calar, de maneira que obteñamos o 40 % dos votos. Podemos interpretar isto como que, se o Condenamos nós, os votantes pensarán que o alcalde era unha soa mazá podre que nós mesmos estamos a denunciar e non nos castigarán moito.

Se no Partido Laranxa escollemos Calar, o peor que nos pode ocorrer é que os Amarelos escollan Condenar e obteñamos o 25 % dos votos. Podemos interpretalo como que, se o destapan eles, os votantes castigarannos moito.

Finalmente, se os Laranxas escollemos Defender, o peor é que eles elixan Calar e obteñamos o 15 % dos votos. Podemos interpretalo como que o pobo pensa: excusatio non petita, accusatio manifesta.2

E agora escollemos a mellor desas tres opcións: Condenar. Conseguimos o 40 % dos votos e non gobernaremos, pero ao menos obteremos uns poucos concelleiros.

Nótese que non estamos dicindo «se nós escollemos Condenar, eles escollerán Calar», senón «se nós escollemos Condenar, non sabemos o que van elixir eles, pero o peor que podería pasarnos é que escollesen Calar». Non sabemos o que van escoller no Partido Amarelo porque non sabemos a matriz de pagamentos que teñen eles. Poida que as súas enquisas sexan peores (ou mellores), ou que non sexan xogadores racionais, ou calquera cousa. Tanto nos ten. Estamos a supor que non sabemos como vai elixir o Partido Amarelo e póndonos no peor dos casos.

É coma se dixésemos «confórmome con ganar pouco no canto de arriscarme a ganar moito e enganarme» ou «escollo o máximo dos mínimos». É por iso que dicimos que Maximin é unha estratexia conservadora.

Por suposto, a escolla dos valores da matriz non é trivial; de feito, é importantísima. Poida que os nosos políticos os achasen mediante enquisas de intención de voto, a través da súa experiencia ou como sexa. Se a matriz fose outra, os mínimos serían outros e o máximo dos mínimos tamén sería outro. Neste caso concreto semella que, cando o Partido Laranxa Condena o seu propio alcalde, é por honra e por respecto ás leis, se ben realmente baséase nun desapiadado cálculo. Pero non nos centremos no caso concreto do exemplo, senón no procedemento. O feito de que saíse iso no noso exemplo é unha pura casualidade e depende dos números que escollamos para o mesmo.3

Relacionada coa estratexia Maximin está a estratexia Minimax.

Estratexia Minimax: consiste en escoller a opción que nos dea a mínima perda das máximas posibles consecuencia das posibles escollas do opoñente.

 

Realmente é o mesmo, pero ás veces atopamos problemas para describir as ganancias e énos máis doado describir perdas. Neste caso adoitamos cambiar os signos da matriz de pagamentos, de xeito que pomos as perdas en positivo e entón o noso obxectivo non é conseguir canto máis mellor, senón canto menos mellor. Neste caso, a linguaxe empregada cambia e debemos empregar a palabra Minimax. Pero, se o pensamos con coidado, veremos que o algoritmo é o mesmo e, de feito, teño a sensación de que Minimax é máis usada como expresión coloquial ca Maximin.4

Maximin na árbore de decisión

Como viamos, cando representabamos o xogo na súa forma estratéxica (nunha matriz de pagamentos), debiamos supor que nós xa decidiramos e pornos no peor dos casos a partir de aí. Pero, se o presentamos en forma de árbore, esa suposición xa está implícita naquel nó en que nos atopamos. Seica se verá máis claro deste xeito, porque se ve o camiño que vai seguindo a decisión e, ademais, permítenos pór énfase no feito de que non estamos anticipando o que vai facer o opoñente, senón soamente póndonos no peor dos casos.

Vámolo ver cun exemplo. Supoñamos que temos un xogo que podemos representar coa seguinte árbore (non se me ocorre ningún exemplo real que lle acaia, así que non vou forzalo; supoñamos que a árbore é esa e punto):

Ana pode decidir X, Y ou Z. Para cada unha das súas decisións, Alberte ten varias escollas posibles, que levarán a unha determinada recompensa para Ana.

Nótese (e este é o punto sobre o que quería facer énfase no escándalo de corrupción máis arriba) que non pomos a recompensa de Alberte en sitio ningún. Se coñecésemos a recompensa de Alberte nun punto dado, resultaríanos máis doado, porque sabemos que Alberte escollerá maximizando a súa propia recompensa. Pero entón non estariamos perante unha estratexia Maximin, senón simplemente anticipando as escollas de Alberte, como xa fixemos anteriormente ao longo da serie. Cando aplicamos unha estratexia Maximin é porque non podemos anticipar as decisións que tomará o outro, ben porque non coñecemos as súas recompensas (e, polo tanto, non sabemos cal das súas decisións lle favorecerá máis), ben porque, mesmo coñecéndoas, non sabemos se o outro vai comportarse dun xeito racional (egoísta) ou irracional ou social ou malvado, ben porque el cre que as súas recompensas serán outras e, mesmo actuando de xeito racional, non sabemos en que matriz de pagamentos está a basear as súas escollas.

Por favor, perdoade que insista tanto neste punto, pero é que moitos dos textos que lin son ambiguos e paréceme que non sempre queda claro.

Se o xogo era de suma cero e de dous xogadores e con información perfecta, por exemplo nunha partida de xadrez, a énfase que facemos é innecesaria (e creo que é por isto que outros textos non a fan), pero se o xogo non é de suma cero ou, mesmo séndoo, é de máis de dous xogadores, ou mesmo nese caso, se a información non é perfecta, podemos coñecer as nosas recompensas sen coñecermos as dos opoñentes e, polo tanto, non podemos anticipar as súas decisións.

Entendido? Por favor, erguede a man se alguén non o entendeu.

Así que, insistimos, soamente nos interesan as recompensas para Ana. A idea é irmos collendo, en cada decisión de Alberte, o peor caso, aquel que nos proporciona unha menor recompensa, é dicir, A(1), D(5) e G(4), e agora escoller a mellor delas: Y(5). Sabemos que, nese caso, a nosa recompensa será sempre ao menos 5 (ao menos 5, podería ser mesmo 7). Renunciamos a poder obter o 14, pero ao menos sabemos que non obteremos o 1. Maximin.

Se a árbore ten unha profundidade meirande ca dous, tamén podemos facer a análise Maximin. Vexamos unha árbore moi complicada, con varias quendas de decisión e con tres xogadores: Ana, Alberte e mais o seu can, con quen están a xogar a un xogo complicadísimo cunha pelota. É un exemplo magnífico de como algún dos xogadores pode non ser racional e, mesmo así, podemos aplicar Maximin (porque, de feito, o porqué da súa decisión non nos importa: pómonos no peor).

Supoñamos que a árbore de decisión nun determinado momento é a seguinte:

Unha vez máis, estiven pensando moito como podería empregar un exemplo real de decisións que nos levasen a considerar esta árbore, pero tras pensalo moito foime imposible imaxinar un xogo que chegase a esta árbore. Así que deixei de tentalo. Vós imaxinades que o xogo é este e é moi divertido e pode describirse así e listos.

Comezamos resolvendo todas as decisións que non dependen de Ana póndonos no peor caso. Tanto nos ten se é porque o xogador que toma a decisión é irracional, como podería ser o caso do can, ou porque toma a súa decisión baseándose en criterios que non coñecemos, como podería ser o caso de Alberte. Simplemente pómonos no peor caso e listo.

Agora podemos simplificar todas esas ramas da árbore a ese caso peor:

Aínda hai outra poda que podemos facer. Poderiamos facelo nun só paso, pero así ímolo vendo todo paseniño:

Agora xa non podemos simplificar máis sen facer que Ana escolla. Escollemos o máximo en todas as decisións de Ana e logo simplificamos o debuxo:

Outra vez estamos nun estado no que todas as decisións dependen de alguén que non é Ana, así que, unha vez máis, pómonos no peor dos casos:

E, finalmente, escollemos o máximo:

Entón, ten de conformarse Ana con ganar 5? Non pode tentar ir polo 10? É máis racional que Ana escolla 5 ou que tente ir polo 10 mesmo arriscándose a non conseguilo? O lector astuto verá aquí palabras como «arriscarse» ou «tentar» que poden facernos pensar que introducir a estatística na análise podería axudarnos. Pero iso quedará para o vindeiro artigo, porque este xa está quedando longo de máis.

[O seguinte artigo da serie é Teoría de xogos (XIX): Os tenistas (I).]


Este artigo e mais a súa tradución están publicados baixo licenza CC BY-NC-ND 2.5 ES.


1. Desgraciadamente, malia que o momento no que escribo isto e o momento no que o les poidan estar moi afastados no tempo, seguro que algún novo escándalo de corrupción converte esta frase en verdadeira, sexa a data que sexa. Snif.

2. Escusa non pedida, acusación manifesta.

3. Mentira. Por suposto, non é casualidade: eu escollín eses números á mantenta para que saíse exactamente iso.

4. Ben… coloquial no seu senso máis amplo. Non vexo a miña avoa usando coloquialmente a palabra Minimax. Pero si é certo que moitas disciplinas que estudan pouco ou nada sobre teoría de xogos empregan o concepto de Minimax.

Advertisements

Deixar unha resposta

introduce os teu datos ou preme nunha das iconas:

Logotipo de WordPress.com

Estás a comentar desde a túa conta de WordPress.com. Sair /  Cambiar )

Google+ photo

Estás a comentar desde a túa conta de Google+. Sair /  Cambiar )

Twitter picture

Estás a comentar desde a túa conta de Twitter. Sair /  Cambiar )

Facebook photo

Estás a comentar desde a túa conta de Facebook. Sair /  Cambiar )

Conectando a %s