Teoría de xogos (XVII): A caza do cervo

[Esta é unha tradución autorizada de Ciención de Breogán, adaptada do artigo orixinal de 3 de xaneiro de 2011 Teoría de juegos XVII – La caza del ciervo, de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, dispoñible aquí.]

[O artigo previo da serie é Teoría de xogos (XVI): Dilema do prisioneiro iterativo (II).]

Antes de avanzarmos máis, imos presentar un xogo novo, intimamente relacionado co dilema do prisioneiro que viamos antes e que moitos consideran a mellor forma de modelar a cooperación social. O xogo chámase a caza do cervo.

Cervo
De verdade queres cazalo? [Fonte: Pixabay, dominio público]
Serviranos para afianzar os conceptos de equilibrio de Nash e estratexia dominante, e tamén para introducirmos un concepto novo: a suma cero.

O xogo di algo así: temos dous lobos, Rómulo e mais Remo, que poden decidir ir cazar un Coello ou cooperaren para cazar un Cervo.

Se un deles decide cazar un Coello, come. Non é festín ningún, pero vaia, come. Se ambos a dous deciden ir xuntos cazar un Cervo, aquilo é unha lupanda. Non soamente comen, senón que ademais obteñen enerxías sobrantes que poden dedicar a, por exemplo, a reprodución.

Pero, se un deles decide ir polo Cervo e o outro vai polo Coello, quen decidiu ir polo Cervo queda sen nada, porque el só non é quen a cazalo (porén, o seu «amigo», que foi polo Coello, si come).

Podemos representar isto segundo a seguinte matriz de pagamentos (pomos primeiro a recompensa de Rómulo e logo a de Remo):

Remo
Cervo Coello
Rómulo Cervo 4, 4 0, 3
Coello 3, 0 3, 3

Representamos cun 3 o feito de que comen, cun 4 o feito de que non soamente comen, senón que fan un banquete, e cun 0 o feito de que quedan co bandullo baleiro.

Coello
A alternativa tamén é entrañable… Nalgúns sitios, mesmo son animais de compaña. [Fonte: Pixabay, dominio público]
Existe unha estratexia dominante para algún dos xogadores? Lembremos como se buscaba: para cada unha das posibles decisións do outro xogador, escolliamos a nosa mellor opción. Se é a mesma escolla en todos os casos, iso é unha estratexia dominante.

Pois non tal, neste caso non existe estratexia dominante.

Se Remo escolle Cervo, a mellor escolla de Rómulo é Cervo. Pero se Remo escolle Coello, a mellor escolla de Rómulo é Coello. É dicir, Rómulo non ten unha estratexia dominante (nin tampouco Remo, pois a súa situación é a mesma).

Existe algún equilibrio de Nash? Si, existen dous equilibrios de Nash: Cervo-Cervo e Coello-Coello.

  • Se ambos os dous escolleron Coello, o que cambie a súa escolla a Cervo queda sen nada, así que non está tentado de cambiar. Logo Coello-Coello é un equilibrio de Nash.
  • Se ambos os dous escolleron Cervo, o que cambie a súa escolla a Coello pasa de cobrar 4 a cobrar 3, así que non lle interesa facelo. Logo Cervo-Cervo é un equilibrio de Nash.
  • Se un escolle Coello e o outro Cervo, calquera dos dous cambios beneficia a alguén. Se o que escolleu Coello cambia a Cervo, pasa de ganar 3 a ganar 4. Así que está tentado de cambiar. E o que escolleu Cervo, que actualmente gana 0, tamén sae beneficiado (pasando a ganar 3) se cambia a Coello. Logo Coello-Cervo e Cervo-Coello non son equilibrios de Nash.

Se ben a algúns pareceralles obvio, debemos decatarnos de que as situacións non son as mesmas ca no dilema do prisioneiro, porque a matriz non é exactamente igual, aínda que sexa semellante. Tomemos unha matriz de pagamentos xenérica como a seguinte:

Xogador 2
Alfa Beta
Xogador 1 Alfa a, a c, b
Beta b, c d, d

Xeralmente suponse que estamos nun xogo como a caza do cervo se rexe a relación a > b ≥ d > c (no noso xogo, 4 > 3 ≥ 3 > 0), pero estaremos perante un coma o dilema do prisioneiro ao se cumprir a relación c > d > a > b (no noso exemplo, 0 > –1 > –6 > –10).1 Como estamos a considerar soamente estratexias puras, os valores exactos dos números non afectan, pero, se estudásemos estratexias mixtas, que veremos máis adiante, entón non só é importante a relación, senón tamén o seu valor exacto. E tamén son importantes para sabermos se o xogo é de suma cero ou non.

Suma cero

Xogo de suma cero: un xogo é de suma cero se, para todas as combinacións de escollas, a suma das recompensas de todos os xogadores é cero (ou calquera outro número constante).

 

Obviamente, a caza do cervo, tal como a propomos, é un xogo que non é de suma cero:2 se os lobos coinciden na súa decisión (xa sexa Coello-Coello ou Cervo-Cervo), ambos ganan. Mesmo no caso peor, no que non gana nada, tampouco perde.

Pero, se escollésemos outros números…

Ao longo da serie vimos xogos que si eran de suma cero e xogos que non:

  • De suma cero: «pedra, papel ou tesoiras» (ao menos algunha das versións que dimos), o ultimato, o ditador e moitos que non vimos pero que poden ocorrérselle a calquera: o xadrez, as damas, o póker…
  • Non de suma cero: algunha das versións de «pedra, papel ou tesoiras», a poxa do dólar, o cempés, o xogo da confianza, as pensións e mais o dilema do prisioneiro.

Emprégase tamén o termo suma cero aínda que non sume cero estritamente, senón calquera outro número fixo. Por exemplo, podemos dicir que as eleccións ao Congreso son un xogo de suma cero, porque a suma de todos os deputados de todos os partidos é 350. Se un gana deputados, é porque os perde outro (ou mellor dito, deixa de ganalos). Estritamente, deberiamos dicir que é un xogo de «suma 350», pero cando dicimos que é de suma cero xa se entende, non si? Algúns autores empregan o termo suma constante para representaren esta situación, pero non todos, así que convén pensar que suma cero podería referirse a cando suman un número fixo, independentemente de que sexa cero ou outro.

Suma cero e a bolsa

O feito de saber se un xogo é de suma cero ou non é importante. Fíxate en que, se a suma ten de ser cero, para que alguén gane, outro debe perder. Por exemplo, decidir se o xadrez é de suma cero é unha discusión va. Se perdiches a partida, pois perdíchela; só o teu ego sae danado (agás que sexas un xogador profesional, claro).

Pero decidir se a bolsa é un xogo de suma cero ou non (ou, mellor dito, suma constante ou non) ten consecuencias máis graves. Para que alguén gane cartos na bolsa, ten de deixar de ganalos algún outro (hoxe ou no futuro)? Ou é posible que todos ganen? Durante anos semellou que as ganancias da bolsa podían seguir medrando e medrando de xeito indefinido e que todo o mundo ganaba… pero as caídas dos últimos anos fixeron perder a moitos… a ganancia daqueles era a perda destes? A miúdo dise verbo da bolsa que «para que gane alguén, ten de haber un paparón que perda. E, se non sabes quen é o paparón, logo o paparón es ti». Pois saber se a bolsa é un xogo de suma cero ou non o é consiste en determinar se esa frase é certa ou non.

Falacia de suma cero e a cantidade de traballo

Por suposto, tamén o contrario é malo. Supor que un xogo é de suma cero cando non o é coñécese como falacia de suma cero e pode levar a análises equivocadas (ou mesmo mal intencionadas).

Unha das falacias de suma cero máis habituais é que a cantidade de traballo dispoñible é constante e, polo tanto, se o fan as máquinas por nós, os humanos quedaremos sen traballo. Só fai falla ver a evolución histórica para ver se é certo:

  • Século xv a. de C. Había uns 5 millóns de humanos e todos traballaban.
  • Século i. Poboación: 300 millóns de humanos. Inventouse o acueduto e mais o carro (non fan falla portadores), o arado (non fan falla tantos agricultores)… Quere iso dicir que agora só traballan 3 millóns de humanos? Non tal. Traballan os 300 millóns.
  • Século xix. Poboación: 1000 millóns de humanos. Inventouse a máquina de vapor (non se fabrican máis carros), a máquina de coser (menos costureiras), a imprenta (menos escribáns)… Canta xente traballa? Os mil millóns de humanos.
  • Século xxi. Poboación: 7000 millóns de humanos. Inventouse o ordenador (non máis contables), o walkman (non máis músicos), o correo electrónico (non máis carteiros)… Hai menos xente traballando? Non tal, hai máis. Traballan os 7000 millóns de humanos.3
  • Século xxx. Poboación: 10 000 millóns de humanos e 10 000 millóns de androides. O ser humano non volve pór unha pedra sobre outra, baixar o lombo nin realizar ningunha tarefa pesada ou repetitiva. Logo que? Dedicarase á ciencia, á arte, ao lecer, ao ensino…

Cantas máis máquinas temos, máis xente traballa.

Se cremos que a necesidade laboral é de suma cero, prohibiremos as máquinas. Se sabemos que non é de suma cero, daquela fomentaremos a investigación e a construción de máquinas. É posible que, no curto prazo, automatizar unha planta de produción mande ao paro a dez obreiros, pero no longo prazo iso beneficiará a humanidade no seu conxunto. Entrementres, se queremos (e isto xa non é teoría de xogos senón política), podemos darlles protección social a eses parados ou formalos para que deixen de realizar ese traballo, que xa non é necesario, e aprendan a realizar outro que si o sexa.

Cooperación social

Para moitos autores, o dilema do prisioneiro (e especialmente a súa forma iterativa, como xa vimos) é o mellor xeito de estudar a cooperación social.

Para outros autores, porén, a caza do cervo é unha maneira mellor de estudala e, de feito, moitos dos exemplos reais que poidan ocorrérsenos poden corresponderse cun destes xogos ou co outro dependendo dos valores que escollamos na matriz de recompensas. A especialización das células nos seres pluricelulares, a caza en manda dos lobos e moitas outras especies, a especialización do traballo nas sociedades humanas… Todas son situacións en que seica podería aplicarse mellor a caza do cervo ca o dilema do prisioneiro.

Ademais do exemplo que xa vimos dos lobos en manda, pensemos por exemplo nuns homes prehistóricos. Se toda a tribo vai recoller bagas, todos comerán bagas. É certo que non morrerán de fame, pois os monos levan milenios facéndoo. Pero tamén poden cooperar. Se o que fabrica lanzas se dedica a fabricar lanzas, o que tira moi ben poderá empregar esa arma para cazar un mamut… mamut que sería avistado polo mellor observador e perseguido polo mellor rastrexador, e logo o que mellor cociña poderá ocuparse de conservar ese mamut durante meses, e o que mellor curte a pel encargarase de facer bos abrigos, e así respectivamente ata que todos ganan máis ca se simplemente recollesen bagas. Por exemplo, poden dedicar o exceso de ganancia a pensar como mellorar as súas casas, inventar o arco ou simplemente reproducirse máis porque hai máis comida para as crías.

A explicación de por que este xogo lles semella mellor débese aos matices que existen entre ambos os equilibrios. Porque non, non todos os equilibrios son iguais. O equilibrio Cervo-Cervo é o que se chama de recompensa dominante, porque obteñen maior recompensa,4 mentres o equilibrio Coello-Coello chámase de risco dominante, porque quen o escolle está preferindo non arriscarse a quedar con cero (no vindeiro capítulo veremos a estratexia Maximin e formalizaremos isto un pouco). Semella que os equilibrios de recompensa dominante se escollen máis adoito cando os xogadores coñecen ben a matriz de pagamentos, pero os de risco dominante escóllense máis cando hai dúbidas (verbo das recompensas do outro, fundamentalmente, que son as que nos impiden deducir o que fará ese outro).

Estou desexando ler nos comentarios as opinións dos lectores sobre cal dos dous representa mellor a cooperación social.

Para irmos abrindo o debate, dou a miña: eu penso que o dilema do prisioneiro é unha mellor representación da cooperación social. Por que opino iso? Porque Cervo-Cervo é un equilibrio de Nash, así que o feito de que os seres sociais escollan Cervo-Cervo pode non significar máis ca soster o equilibrio de Nash e non un comportamento verdadeiramente social. Pola contra, o punto Calar-Calar do dilema do prisioneiro non era un equilibrio de Nash, era un punto inestable que vai contra as estratexias dominantes de ambos os xogadores e, malia iso, os xogadores sociais escólleno. Para non nesgar moito o debate coa miña opinión, dou á vez o contraargumento: semella que os seres sociais escollemos o equilibrio de recompensa dominante, mesmo sen coñecermos realmente o outro. É como cando, ás dúas da madrugada, nunha estrada deserta, paras para axudar a un descoñecido que está parado na beiravía co capó aberto e o coche botando fume.

A ver esas opinións…

[O seguinte artigo da serie é Teoría de xogos (XVIII): Escándalo de corrupción.]


Este artigo e mais a súa tradución están publicados baixo licenza CC BY-NC-ND 2.5 ES.


1. Por suposto, outras relacións son posibles, pero non todas teñen un nome propio.

2. Xa sei que, gramaticalmente, non ten sentido escribilo así, pero é a terminoloxía que se emprega.

3. Mesmo cun 20 % de paro, que aquí non o contamos, seguen traballando moitos máis ca antes.

4. Tecnicamente dicimos que é un óptimo de Pareto ou paretóptimo, pero como non imos ver o óptimo de Pareto, ímolo deixar aí.

Advertisements

Deixar unha resposta

introduce os teu datos ou preme nunha das iconas:

Logotipo de WordPress.com

Estás a comentar desde a túa conta de WordPress.com. Sair /  Cambiar )

Google photo

Estás a comentar desde a túa conta de Google. Sair /  Cambiar )

Twitter picture

Estás a comentar desde a túa conta de Twitter. Sair /  Cambiar )

Facebook photo

Estás a comentar desde a túa conta de Facebook. Sair /  Cambiar )

Conectando a %s