El Dilema del Prisionero



El Dilema del Prisionero (Prisoner's dilemma) es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la Teoría de Juegos.

Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos.  El alguacil sospecha que han participado en el robo del banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel.  Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco.

Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.

Dilema del prisionero
Matriz de Pagos
(años de cárcel)
    Preso Y
    lealtad traición
Preso X lealtad 2 \ 2 10 \ 1
traición 1 \ 10 5 \ 5

Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.


 En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general.

Dilema del prisionero
Matriz de Pagos
(orden de preferencias)
    Preso Y
    lealtad traición
Preso X lealtad 2 \ 2 4 \ 1
traición 1 \ 4 3 \ 3*

La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está señalado en la matriz mediante un asterisco.

El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal, biestratégico y simétrico. Fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias reactivas.

 Otros artículos sobre Teoría de Juegos incluidos en este CD-ROM o sitio web:

Aplicaciones