Teoría de xogos (XIX): Os tenistas (I)

[Esta é unha tradución autorizada de Ciención de Breogán, adaptada do artigo orixinal de 24 de xaneiro de 2011 Teoría de juegos XIX – Los tenistas (I), de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, dispoñible aquí.]

[O artigo previo da serie é Teoría de xogos (XVIII): Escándalo de corrupción.]

Tenis

Case desde o comezo desta serie fomos propondo xogos, introducindo conceptos sinxelos sobre a teoría de xogos e aplicándollelos a eses xogos, e fomos perfeccionando o noso coñecemento dos xogos que estudabamos.

Hoxe imos introducir o concepto de estratexias mixtas e para isto imos convidar a Ana e mais Alberte a xogar ao tenis.

Sempre que lin algunha cousa verbo deste xogo ou algunha variación, foi con xogadores de béisbol que teñen de decidir se guindan unha bóla rápida ou unha lenta. Pero, como en España case non hai tradición beisboleira e nin sequera sei o que diferencia unha bóla rápida dunha lenta (supoño que unha irá a máis velocidade ca a outra, pero non sei como afecta iso), nós imos facer o xogo con tenistas.

Por suposto, non imos escribir un tratado sobre tenis (entre outras cousas porque, ademais, son bastante malo xogando), pero si imos empregar a súa terminoloxía para darlle cor ao artigo. Se ben espero que poidas seguir o texto sen problema ningún malia non coñeceres o argot tenístico, podes botarlle unha ollada á Galipedia ou ir ver algún partido e logo volver aquí.

Alberte está ao servizo e Ana ao resto. Ana pode decidir prepararse para recibir un servizo ao seu drive,1 dando un pasiño cara á dereita (a súa dereita, non a dereita do debuxo), ou pode prepararse para recibir un servizo ao seu revés,2 dando un pasiño cara á súa esquerda. Alberte, ao mesmo tempo, pode decidir sacar cara ao drive de Ana ou cara ao revés de Ana.

Ademais, imos supor que ambos os dous deben tomar a decisión asemade. Poderiamos pensar que Ana se porá no seu sitio, Alberte veraa e saberá o que decidiu Ana e entón decidirá el. Ben, pois non tal. Ana colocarase no centro e dará o pasiño no último momento, cando Alberte xa decidiu e está sacando, así que imos supor que ambos toman a decisión á vez. Nun xogo real, ademais, cada un podería tentar enganar o outro colocándose cara a unha banda e movéndose logo cara á outra, ou mediante a súa linguaxe corporal, de xeito semellante ao que fan un xogador e un porteiro nun penalti de fútbol. Pero imos simplificalo e diremos que, simplemente, ambos deciden asemade.

Vexámolo cun debuxo:3

Tenistas

Non é difícil decatarse de que, se a decisión de Ana coincide co saque que Alberte pretende facer, resultaralle moito máis doado restar,4 mentres que, se non o consegue, Alberte probablemente conseguirá un ace.5

Logo vamos estimar unha matriz de recompensas na que amosaremos a probabilidade de que Ana non consiga restar e, polo tanto, Alberte consiga o ace.6

Ana prepárase para…
Drive Revés
Alberte saca… Ao drive 10 % 30 %
Ao revés 50 % 20 %

Nótese que estamos a amosar as probabilidades de que Alberte consiga o ace, non certezas absolutas. Así, se Ana se preparou para un drive pero Alberte saca ao revés, logrará un ace a metade das veces; pola contra, se lla tirar ao drive, lograrao soamente un 10 % das veces. Malia isto, e para non learnos, podemos supor que os números que aparecen aí son pagamentos que recibe Alberte e o seu obxectivo é maximizalos (e o de Ana minimizalos, claro).

Poñámonos no lugar de Alberte. Que debe facer? Ten Alberte algunha estratexia dominante que lle permita maximizar a súa probabilidade de conseguir un ace?

Non. Cos coñecementos que vimos polo de pronto, non ten unha estratexia dominante. Se Ana se preparou para o revés, a mellor estratexia de Alberte é sacar ao drive, pero se Ana se preparou para o drive, o mellor é sacar ao revés.

Poderiamos pensar que Alberte debería sacar sempre ao revés porque, se dá a casualidade de que Ana vai ao drive, ten un 50 %! Xa ten medio punto ganado! Así que debería sacar sempre ao revés… Pois non. Porque, se fixer iso de xeito sistemático, Ana decatarase decontado, prepararase sempre para o revés e Alberte só conseguirá un 20 %.

Pero… se Ana fai iso, Alberte pode cambiar e comezar a sacar ao drive, conseguindo un 30 %. Home, non é o 50 % que tiña antes, pero non está mal… O que pasa é que, se comezar a facer iso sempre, en todos os saques, Ana tamén se decatará rapidamente e prepararase para o drive.

Xa o teño! Daquela o mellor é sacar unhas veces cara a unha banda e outras veces cara á outra.

Ben pensado: iso é unha estratexia mixta.

Estratexias mixtas

Estratexia mixta: consiste en tomar cada unha das decisións i cunha probabilidade pi.

 

Non te sorprenderá moito que se empregue o termo estratexia pura como contraposición ao termo estratexia mixta…

Agora, tendo isto en conta, existe unha estratexia mixta que sexa a mellor estratexia mixta?

Si tal.7 John Nash demostrou que todos os xogos teñen ao menos un equilibrio de Nash en estratexias mixtas.

Así que, antes de continuarmos, temos de refinar un pouco a nosa definición de equilibrio de Nash para acomodar o concepto de estratexias mixtas.

Equilibrio de Nash en estratexias mixtas: un conxunto de distribucións de probabilidades entre as diferentes opcións de todos os xogadores é un equilibrio de Nash se ningún dos xogadores mellora a súa esperanza cambiando a súa distribución de probabilidades (e deixando constantes todas as demais).

 

Como agora xa non estamos a falar de que os xogadores tomen unha determinada decisión, senón de que as tomarán cunha certa probabilidade pi, non podemos empregar o pagamento como medida da bondade da estratexia, senón que debemos utilizar a esperanza de pagamento.8

O mellor é velo cun exemplo.

Imaxinemos que Alberte decide empregar unha estratexia mixta: o 90 % das veces sacará ao revés (e, consecuentemente, o 10 % restante sacará ao drive). Pola outra banda, Ana decide prepararse para recibir un drive o 60 % das veces (e para recibir un revés o 40 % restante).

Coidado, porque aquí non debemos confundir as probabilidades de elixir unha decisión coas probabilidades de conseguir o ace cando xa estamos nun punto determinado. Como dixemos máis arriba, para isto debemos considerar os números da matriz como pagamentos e punto. Así que, para evitar esta confusión, imos quitar todos os símbolos de porcentaxe da matriz de pagamentos:

Ana prepárase para…
Drive Revés
Alberte saca… Ao drive 10 30
Ao revés 50 20

Agora xa non debemos preocuparnos do que representan eses números, só debemos saber que o obxectivo de Alberte é conseguir o pagamento máis alto e que o de Ana é que Alberte consiga o pagamento máis baixo.

Entendido ata aquí? Relé estes últimos parágrafos antes de seguires.

Así que dixemos que ambos os dous empregarían unha estratexia mixta:

Ana prepárase para…
Drive (60 %) Revés (40 %)
Alberte saca… Ao drive (10 %) 10 30
Ao revés (90 %) 50 20

A esperanza matemática destas distribucións de decisións resulta de multiplicar cada punto da matriz polas probabilidades correspondentes ás súas decisións (ollo: en tanto por un, non en porcentaxe) e logo sumalo todo. É dicir:

E = 10 · 0,6 · 0,1 + 30 · 0,4 · 0,1 + 50 · 0,6 · 0,9 + 20 · 0,4 · 0,9 = 0,6 + 1,2 + 27 + 7,2 = 36.

A esperanza de pagamento para Alberte resultante desta distribución de probabilidades é 36.

Por suposto, unha distribución de probabilidades distinta dará unha esperanza distinta. Alberte tentará escoller tal distribución de probabilidades que esa esperanza de pagamento se maximice, mentres Ana tentará elixir unha que a minimice.

Podemos determinar cal é a distribución de probabilidades óptima?

Pois, desgraciadamente, ata onde sei eu, non sempre podemos. Existirán xogos onde atopar ese equilibrio de Nash dun xeito máis ou menos intuitivo será doado (mesmo veremos algún no futuro), pero no caso xeral non é doado. A demostración que fixo Nash é o que os matemáticos chaman unha demostración non construtiva. É dicir: demostra que hai unha solución pero non di como conseguila. Nash demostrou que, para calquera xogo, existe ao menos un equilibrio de Nash con estratexias mixtas, pero non demostrou como atopar tal equilibrio.

Posteriormente descubríronse métodos para atopar ese equilibrio, pero implican matemáticas complicadas cun alto custo computacional. Así que na segunda parte veremos unha forma de atopar un punto de equilibrio empregando un método de gradiente (e consecuentemente imos deixar o artigo aquí, que xa está quedando longo de máis).

Non podo rematar o artigo sen meter un pouco de humor friqui de economistas:

Quen xoga cunha pedra, unhas tesoiras e un papel é John Nash. Se non dominades a lingua de Shakespeare, di:

—Atopei a estratexia óptima para «pedra, papel ou tesoiras»!

—Parabéns! Ganaches o premio Nobel!

En realidade déronlle o Nobel por toda a súa achega, pero é un chiste. Ademais, nin sequera fixo iso: como vimos, demostrou que existía unha estratexia óptima para «pedra, papel ou tesoiras» (en realidade, para calquera xogo), pero non achou cal era.

A imaxe é unha captura dun vídeo humorístico do doutor Yoram Bauman. Cómpre coñecer algo de macroeconomía (non moita) para cachar a maioría dos chistes (e ademais defenderse co inglés, porque fala bastante rápido).

Na segunda parte, máis.


Este artigo e mais a súa tradución están publicados baixo licenza CC BY-NC-ND 2.5 ES.


1. No argot tenístico adoita denominarse co nome inglés drive o golpe «normal» cando es destro e a bóla vén pola túa dereita.

2. No argot denomínase «revés» o golpe que dás cando es destro e a bóla che vén pola esquerda. Loxicamente, se es xergo, as posicións cambian.

3. Supomos que Ana é destra e, polo tanto, o seu drive é á súa dereita e o seu revés é á súa esquerda.

4. No argot tenístico, «restar» é devolver a bóla correctamente tras o saque do contrario.

5. Un ace prodúcese cando quen saca o fai tan ben que o que resta nin sequera é quen a golpear a bóla (nin cheira a pelota, vaia); polo tanto, consegue o punto directo.

6. Pomos valores moi altos, probablemente moito máis altos ca os axeitados para un partido de verdade entre tenistas profesionais, pero facémolo só para esaxerar os números e que nos quede claro.

7. Ao menos para algunha noción de «mellor». Veremos máis adiante que pode ser un «óptimo local».

8. Aquí empregamos a palabra «esperanza» no senso matemático, é dicir, «media». «Logo», dirá o lector astuto, «por que non usas “media” e listo?». Estiven tentado para facelo máis comprensible, pero finalmente decidín non facelo porque case toda a literatura emprega «esperanza» e convén afacerse ao vocábulo.

Advertisements

Deixar unha resposta

introduce os teu datos ou preme nunha das iconas:

Logotipo de WordPress.com

Estás a comentar desde a túa conta de WordPress.com. Sair /  Cambiar )

Google+ photo

Estás a comentar desde a túa conta de Google+. Sair /  Cambiar )

Twitter picture

Estás a comentar desde a túa conta de Twitter. Sair /  Cambiar )

Facebook photo

Estás a comentar desde a túa conta de Facebook. Sair /  Cambiar )

Conectando a %s