por Felipe COSTALES
i.u.p. Santiago Mariño, San Cristobal, Venezuela
E-mail:
felcos@cantv.net
14 junio 2001
01.Introducción:01.Introducción
02. ¿Qué es la teoría de juegos?
03. Origen de la teoría de juegos
04. Aplicaciones de la Teoría de Juegos:04.1. En la Economía.05. Propiedades para el conocimiento común del juego.
04.2. En la Ciencia Política.
04.3. En la Biología.
04.4. En la Filosofía.
06. Conocimiento común de las regla.
07. Lo que saben y lo que creen.
08.Comentarios generales.
09 Juegos de suma cero de dos personas.
10 Estrategias maximin y minimax.
11 Punto de silla de montar.
12 Estrategia dominante.
13 Estrategia mixta.
14 Modelo de formación de colas.
15 El modelo de cola de una sola estación.
16 Nota sobre regla de prioridad.
17 Modelo de cola de una estación múltiple.
18 Simulación Monte Carlo.
19 Tamaño óptimo de un equipo de servicio.
20 Conclusiones.
02.¿Qué es la Teoría de Juegos?:En el presente trabajo de investigación se pretende realizar un enfoque de la teoría de juegos con el fin de conocer a fondo cual es su ciencia, desde su origen y que es exactamente, por otro lado, a través de esta investigación deberemos conocer cuales son las aplicaciones de la teoría de juegos y sus aplicaciones, es decir, en que áreas es aplicable la teoría de juegos con ejemplos muy prácticos.
La Teoría de Juegos se desarrollo con el simple hecho de que un individuo se relacionen con otro u otros. Hoy en día se enfrenta cotidianamente a esta teoría, en cualquier momento, tenemos por ejemplo cuando nos inscribimos en un nuevo semestre en la universidad, cuando la directiva toma la decisión sobre el monto que se va a cobrar, la directiva está realizando un juego con sus clientes, en este caso los alumnos. Para el hombre la importancia que representa la Teoría de Juegos es evidente, pues a diario se enfrenta a múltiples situaciones que son juegos.
Actualmente la Teoría de Juegos se ocupa sobre todo de que ocurre cuando los hombres se relacionan de forma racional, es decir, cuando los individuos se interrelacionan utilizando el raciocinio. Sin embargo, la Teoría de Juegos tiene todas las respuestas a los todos problemas del mundo.
03.Orígen de la Teoría de Juegos:Evidentemente definir la Teoría de Juegos es tan absurda como su lógica, pero la realidad es que la Teoría de Juegos consiste en razonamientos circulares, los cuales no pueden ser evitados al considerar cuestiones estratégicas. Por naturaleza, a los humanos no se les da muy bien pensar sobre los problemas de las relaciones estratégicas, pues generalmente la solución es la lógica a la inversa.
En la Teoría de Juegos la intuición no educada no es muy fiable en situaciones estratégicas, razón por la que se debe entrenar tomando en consideración ejemplos instructivos, sin necesidad que los mismos sean reales. Por lo contrario en muchas ocasiones disfrutaremos de ventajas sustanciales estudiando juegos, si se eligen cuidadosamente los mismos. En estos juegos-juegos, se pueden desentender de todos los detalles. Si en lugar de utilizar personajes ficticios utilizamos personajes reales para los juegos si se observase qué tan honesto es ese personaje, cómo manipularía la información obtenida, etc. Para un especialista en Teoría de Juegos el ser deshonesto, etc., sería un error comparable al de un matemático que no respeta las leyes de la aritmética porque no le gustan los resultados que está obteniendo.
04.Aplicaciones de la Teoría de Juegos:La Teoría de Juegos fue creada por Von Neumann y Morgenstern en su libro clásico The Theory of Games Behavior, publicado en 1944. Otros habían anticipado algunas ideas.Los economistas Cournot y Edgeworth fueron particularmente innovadores en el siglo XIX. Otras contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo. El mismo Von Neumann ya había puesto los fundamentos en el artículo publicado en 1928. Sin embargo, no fue hasta que apareció el libro de Von Neumann y Morgenstern que el mundo comprendió cuán potente era el instrumento descubierto para estudiar las relaciones humanas.
Todavía encontramos profesores mayores que nos explican que la Teoría de juegos o sirve para nada porque la vida no es un "Juego de suma cero", o porque se puede obtener el resultado que uno quiera seleccionando el apropiado "concepto de solución cooperativa".
Afortunadamente las cosas han evolucionado con mucha rapidez en los últimos veinte años, y éste y otros libros modernos sobre teoría de juegos ya no padecen algunos de los presupuestos restrictivos que Von Neumann y Morgenstern consideraron necesarios para progresar. Como resultado, lo que la teoría de juegos prometía en un principio se está empezando a cumplir. En los últimos años, sus repercusiones en la teoría económica sólo se pueden calificar de explosivas. Todavía es necesario, sin embargo, saber algo de la corta historia de juegos, aunque sólo sea para entender por qué se usan algunos términos.
Von Neumann y Morgenstern investigaron dos planteamientos distintos de la Teoría de Juegos. El primero de ellos el planteamiento estratégico o no cooperativo. Este planteamiento requiere especificar detalladamente lo que los jugadores pueden y no pueden hacer durante el juego, y después buscar cada jugador una estrategia óptima. Lo que es mejor para un jugador depende de lo que los otros jugadores piensan hacer, y esto a su vez depende de lo que ellos piensan del primer jugador hará. Von Neumann y Morgenstern resolvieron este problema en el caso particular de juegos con dos jugadores cuyos intereses son diametralmente opuestos. A estos juegos se les llama estrictamente competitivos, o de suma cero, porque cualquier ganancia para un jugador siempre se equilibra exactamente por una pérdida correspondiente para el otro jugador. El ajedrez, el backgammon y el póquer son juegos tratados habitualmente como juegos de suma cero.
La segunda parte del libro de Von Neumann y Morgenstern desarrollaron el planteamiento coalicional o cooperativo, en el que buscaron describir la conducta óptima en juegos con muchos jugadores. Puesto que éste es un problema mucho más difícil, no es de sorprender que sus resultados fueran mucho menos precisos que los alcanzados para el caso de suma cero y dos jugadores. En particular, Von Neumann y Morgenstern abandonaron todo intento de especificar estrategias óptimas para jugadores individuales. En lugar de ello se propusieron clasificar los modelos de formación de coaliciones que son consistentes con conductas racionales. La negociación, en cuanto a tal, no jugaban papel alguno en esta teoría. De hecho, hicieron suyo el punto de vista, que había predominado entre los economistas al menos desde la época de Edgeworth, según el cual los problemas de negociación entre dos personas son inherentemente indeterminados.
A principio de los años cincuenta, en una serie de artículos muy famosa el matemático John Nash rompió dos de las barreras que Von Neumann y Morgenstern se había auto-impuesto. En el frente no cooperativo, estos parecen haber pensado que en estrategias la idea de equilibrio, introducida por Cournot en 1832, no era en sí misma una noción adecuada para construir sobre ella una teoría –de aquí que se restringieran a juegos de suma cero-. Sin embargo, la formulación general de Nash de la idea de equilibrio hizo ver claramente que una restricción así es innecesaria. Hoy día, la noción de equilibrio de Nash, la cual no es otra cosa que cuando la elección estratégica de cada jugador es la respuesta óptima a las elecciones estratégicas de los otros jugadores. A Horace y Maurice les fueron aconsejados, por su consultor especialista en teoría de juegos, que usaran un equilibrio de Nash. Es tal vez, el más importante de los instrumentos que los especialistas en teoría de juegos tienen a disposición. Nash también hizo contribuciones al planteamiento cooperativo de Von Neumann y Morgenstern. Nash no aceptó la idea de que la teoría de juegos debe considerar indeterminados problemas de negociación entre dos personas y procedió a ofrecer argumentos para determinarlos. Sus ideas sobre este tema fueron generalmente incomprendidas y, tal vez como consecuencia de ello, los años que la teoría de juegos paso en Babia se gastaron principalmente desarrollando el planteamiento cooperativa de Von Neumann y Morgenstern en direcciones que finalmente resultaron improductivas.
La historia de la teoría de juegos en los últimos veinte años está demasiado repleta de incidentes para ser contada. Algunos nombres, sin embargo, no deben ser pasados en silencio. El acróstico NASH puede ayudar a quienes son. El propio Nash tiene la letra N, A por Aumann, S es Shapley y también por Selten y H es por Hansanyi.
Lo que es tal vez más importante sobre los últimos veinte años de teoría de juegos es que los mayores progresos se han dado en la teoría no cooperativa.
Es difícil explicar hacia donde se dirige la teoría de juegos a una audiencia que no sabe dónde se encuentra. Estas observaciones, por tanto, son para quienes ya saben algo de teoría de juegos.
Tengo opiniones muy decididas sobre la dirección que la teoría de juegos debería tomar, y es reconfortante ver las cosas parece que se mueven en la dirección correcta. Es justo, sin embargo, que en algún momento ponga las cartas boca arriba. Así pues tengo que decir que creo que la mayor parte de la literatura sobre "refinamientos del equilibrio de Nash" ha de ser catalogada junto con las obras de la escolástica medieval. Para ser incluso más polémico, quiero añadir que los intentos por hacer del bayesianismo los fundamentos de la teoría de juegos no deben ser comparados a la construcción de casas sobre arena, sino a la construcción de castillos en el aire. Visto retrospectivamente, nos parecerán realmente muy extraños los intentos actuales de hacer de la teoría bayesiana de la decisión algo más que un instrumento analítico conveniente.
La Teoría de Juegos actualmente tiene muchas aplicaciones, sin embargo, la economía es el principal cliente para las ideas producidas por los especialistas en Teoría de Juego. Entre las disciplinas donde hay aplicación de la Teoría de Juegos tenemos:
04.1. En la Economía:No debería sorprender que la Teoría de Juegos haya encontrado aplicaciones directas en economía. Esta triste ciencia se supone que se ocupa de la distribución de recursos escasos. Si los recursos son escasos es porque hay más gente que los quiere de la que puede llegar a tenerlos. Este panorama proporciona todos los ingredientes necesarios para un juego. Además, los economistas neoclásicos adoptaron el supuesto de que la gente actuará racionalmente en este juego. En un sentido, por tanto, la economía neoclásica no es sino una rama de la Teoría de Juegos. Los economistas que no se dan cuenta de ello son como el monsieur Jourdain de Le Bourgeois Gentilhomme, de Moliere, que se sorprendió de saber que había estado hablando en prosa durante toda la vida sin saberlo. Sin embargo, aunque los economistas pueden haber sido desde siempre especialistas camuflados en Teoría de Juegos, no podían progresar por el hecho de no tener acceso a los instrumentos proporcionados por Von Neumann y Morgenstern. En consecuencia sólo podían analizar juegos particularmente simples. Esto explica por qué el monopolio y la competencia perfecta se entienden bien, mientras a todas las demás variedades de competencia imperfecta que se dan entre estos dos extremos sólo ahora se les está empezando a dar el tratamiento detallado que merecen.
La razón por la que el monopolio es simple desde el punto de vista de la Teoría de Juegos es que puede ser tratado como un juego con un único jugador. La razón por que la competencia perfecta es simple es que el número de jugadores es de hecho infinito, de manera que cada agente individual no puede tener un efecto sobre agregados de mercado si el o ella actúa individualmente.
04.2. en la Ciencia política:La Teoría de Juegos no ha tenido el mismo impacto en la ciencia política que en economía. Tal vez esto se deba a que la gente conduce menos racionalmente cuando lo que está en juego son ideas que cuando lo que está en juego es su dinero. Sin embargo, se ha convertido en un instrumento importante para clarificar la lógica subyacente de un cierto número de problemas más paradigmáticos.
Un ejemplo de Teoría de Juegos en la Ciencia Política es el siguiente:
La elección de programa: Hay dos partidos, los Formalistas y los Idealistas. Ninguno de los dos se preocupa en absoluto por cuestiones de principio. Sólo se preocupan por el poder y, por tanto, eligen el programa con el programa con el único objetivo de maximizar el voto en las próximas elecciones. Los votantes, por otra parte, sólo se preocupan por cuestiones de principio y, por ende carecen por completo de fidelidad a los partidos. Para simplificar, las opiniones que un votante puede tener se identifican con los números reales en el intervalo (0. 1), en otras palabras, el conjunto de valores de x que satisfacen 0 menor igual a x menor igual a 1. Podemos imaginarnos que este intervalo representa el espectro político de izquierda a derecha. Así, alguien con la opinión x = 0, se cree que la sociedad debería estar organizada como un hormiguero, mientras que alguien en la opinión x = 1 cree que debería estar organizada como una piscina llena de tiburones.
Cada partido centra su programa en algún punto del espectro político y no puede cambiar su posición posteriormente. Los votantes votan por el partido que se encuentra más cerca de su posición. Dado que se supone que los votantes se encuentran distribuidos uniformemente sobre el espectro político, es decir, que una fracción l de la población sostiene opiniones que se encuentran en cualquier intervalo de longitud l, es fácil ver cuántos votos conseguirá cada partido una vez que han elegido programa. El secreto está en buscar el votante mediano entre aquellos cuyas opiniones se encuentran entre los programas de ambos partidos. El votante mediano se encuentra a medio partido entre las posiciones políticas de los dos partidos. Luego los que se encuentran a la derecha del mediano votante votarán por un partido, y los que se encuentran a la izquierda lo harán por el otro.
Supongamos que los partidos bajan al ruedo político uno a uno. Los Idealistas escogen en primer lugar, y luego lo hacen los Formalistas. ¿Dónde debería colocarse cada uno? Problemas como éste puede ser resueltos por inducción hacia atrás. Para cada programa posible x, los Idealistas se preguntan qué ocurriría si se colocarán en x. Si x es menor a ½, los Formalistas responderían colocándose inmediatamente a la derecha de x. Entonces los Idealistas recogerían una fracción x de los votantes y los Formalistas recogerían 1-x. Por tanto, los Idealistas ganarían menos de la mitad del voto. Lo mismo ocurre si los Idealistas se sitúan en x menor a ½, excepto que ahora los Formalistas responderán colocándose inmediatamente a su izquierda. Por tanto, lo mejor para los Idealistas es colocarse en el centro del espectro político. Los Formalistas también se colocarán en x = ½, y el voto se dividirá mitad y mitad.
Este modelo puede tener sentido en la escena política americana. Ciertamente es difícil para muchos europeos encontrar diferencias significativas entre Demócratas y Republicanos. El modelo, sin embargo, tiene poco parecido con la escena política europea. ¿Deberían los americanos deducir, por tanto, que los partidos políticos europeos de verdad se toman en serio los principios que hacen suyos? Una conclusión así seria prematura porque es dudoso que la situación europea pueda ser razonablemente analizada con un modelo de dos partidos, y esto es cierto incluso para un país como Gran Bretaña en el que sólo dos de los partidos consigue un número importante de votos en la mayoría de elecciones. Para explorar esta cuestión veamos como cambiarían las cosas si tuviéramos que tomar en consideración un tercer partido.
En este modelo el partido Institucionistas escoge programa después de los Idealistas y Formalistas. Esto cambia mucho las cosas. Los Idealistas y los Formalistas ciertamente no se colocarán ahora en el centro del espectro político. Si lo hicieran los Institucionistas se podrían colocar inmediatamente a su derecha o a su izquierda. Entonces recogerían la mitad del voto dejando que los primeros partidos se dividan la otra mitad. Un razonamiento por inducción hacia atrás, algunas sutilezas surgen debido al hecho que disponemos de un número infinito de opiniones políticas, lo cual hace ver que los Idealistas y los Formalistas se colocarán en x = ¼ y x = ¾, dejando que los Institucionalistas adopten la posición centrista x = ½, como se muestra en la Figura anterior parte (b). Los primeros partidos recibirán entonces 3/8 de los votos cada uno, y los Institucionalistas sólo recogerán ¼.
Pero ¿Por qué querrían los Institucionalistas entrar en la arena política está condenados al papel de Cenicienta, con los primeros partidos en el papel de Hermanas Feas?. Modifiquemos, por tanto, el modelo de manera que los instuticionistas consideren que vale la pena formar un partido sólo si pueden prever que recibirán más del 26% de los votos. En este caso los Idealistas se moverán un poco hacia el centro, aunque no lo bastante como para que los Institucionalistas puedan entrar flanqueándolos por la izquierda. Por tanto, sólo se moverán desde x = 0,25 a x = 0,26. Análogamente, los Formalistas se moverán desde x = 0.75 a x = 0.74. El resultado será una elección con dos partidos como lo muestra la parte (c) de la Figura anterior. En esta elección los Idealistas y los Formalistas se dividen el voto a partes iguales y los Institucionalistas se quedan fuera.
Un comentarista político ignorante de la amenaza supone la entrada de los Institucionalistas podría fácilmente malinterpretar las razones por las que los Idealistas y los Formalistas han elegido sus programas. El comentarista podría incluso llegar a pensar que cada partido ni siquiera intenta hacerse con el centro por cuestiones de principio. Pero es sólo tras un análisis estratégico que la conducta de los dos partidos puede ser evaluada correctamente. Obsérvese, en particular, que su conducta ha sido determinada por algo que de hecho no llegó a ocurrir. Como Sherlock Holmes explicaba, a menudo lo importante es que el perro no ladró aquella noche.
04.3. En la Biología:Es imposible igualar el entusiasmo con que los biólogos evolucionistas que usan la teoría de juegos explican de conducta animal. No sé si escogen historias poco delicadas deliberadamente, para dar un poco de sabor a sus relatos con implicaciones sexuales, o si éstos son realmente los mejores ejemplos para ilustrar de qué manera la teoría de juegos es relevante. En cualquier caso, lo que los biólogos dicen sobre el pez sol es esto.
Hay dos clases de machos en esta especie. El primero es un individuo regularmente hogareño que necesita siete años para alcanzar la madurez. Una vez alcanzada, construye un nido que atrae a las hembras que ponen que ponen huevos. Cuando los huevos han sido puestos, no sólo los fertiliza, sino que defiende la familia resultante lo mejor que puede mientras, la hembra continua su vida independientemente. La otra clase de macho es un golfo. Por lo que dicen los biólogos, es poco más que un órgano sexual autopropulsado. Este posee ventaja sobre los machos normales, que consiste en alcanzar la madurez en sólo dos años. Sin embargo, es incapaz de responsabilizarse por su familia. En lugar de ello, espera escondido hasta que una hembra ha puesto sus huevos respondiendo a las señales de un macho normal tenga la oportunidad de hacerlo. Si el golfo tiene éxito, el macho normal defiende una familia que no está relacionada con él en absoluto y que lleva por el contrario los genes del golfo.
La teoría de juegos sirve para explicar por que las dos clases de machos pueden coexistir en proporciones fijas. Para que una historia de teoría de juegos se aguante en este contexto, necesitamos una explicación de cómo los genes se distribuyeron exactamente en la forma necesaria para asegurar a cada pez optimizaría, dada la mezcla actual en la población de hogareños golfos. No basta con decir que la Naturaleza, "con las garras y las fauces llenas de sangre", actuará de forma que sólo quienes se adaptan sobreviven. Esta respuesta rehuye el problema de cómo y por qué resulta que a veces adaptarse implica actuar racionalmente. Esta parece ser una de esas grandes cuestiones que no tienen respuestas fáciles.
04.4. En la Filosofía:05.Propiedades para el conocimiento común del juego:Los especialistas en Teoría de Juegos creen que pueden demostrar formalmente por qué incluso el individuo más egoísta puede descubrir que con frecuencia, cooperar con sus vecinos en una relación a largo plazo redundará en su propio interés ilustrado. Con este fin estudian los equilibrios de juegos con repetición –juegos que los mismos jugadores juegan una y otra vez-. Pocas cosas han descubierto en esta área hasta el presente que hubieran sorprendido a David Hume, quien hace ya unos doscientos años articuló los mecanismos esenciales. Estas ideas, sin embargo, están ahora firmemente basadas en modelos formales. Para avanzar más, habrá que esperar progresos en el problema de la selección de equilibrios en juegos con múltiples equilibrios. Cuando estos progresos se den, sospecho que la filosofía social sin teoría de juegos será algo inconcebible – y que David Hume será universalmente considerado como su verdadero fundador.
06. Conocimiento común de las reglas:El Filósofo Hobbes dijo que un hombre se caracteriza por su fortaleza física, sus pasiones, su experiencia y su razón.
Fortaleza Física: esta determina lo que alguien puede o no puede hacer. Un atleta puede planear correr una milla en cuatro minutos, pero sería imposible para la mayoría ejecutar este plan. La teoría de juegos incorpora estas consideraciones en las reglas del juego. Esta determinan lo que es factible para un jugador. Más exactamente, un jugador queda limitado a escoger en el conjunto de sus estrategias en el juego.
Pasión y Experiencia: estas corresponden a las preferencias y creencias de un jugador. En la mayoría de los casos, ambas deben ser conocimiento común para que sea posible realizar un análisis en términos de la teoría de juegos. Razón: en problemas de decisión unipersonales, los economistas simplemente suponen que los jugadores maximizan sus pagos esperados dadas sus creencias. En un juego las cosas son más complicadas, porque la idea de equilibrio da por supuesto que los jugadores saben algo acerca de cómo razona todo el mundo.
07. Lo que saben y lo que creen:Como en muchos resultados de la teoría de juegos, no es inmediatamente evidente que esta conclusión dependa de que el valor de n debe ser conocimiento común. Sin embargo, si el valor n no es de conocimiento común existe equilibrio de Nash.
La noción de equilibrio es fundamental para la Teoría de Juegos. Pero por qué anticipamos que los jugadores usarán estrategias de equilibrio.
Dos tipos de respuestas hay, en primer lugar del tipo educativo, estos suponen que los jugadores tengan al equilibrio como el resultado de razonar cuidadosamente. No se acepte ante frases que empiezan, "si yo pienso que él piensa que yo pienso ...", por lo contrario, los jugadores proseguirían con razonamiento así hasta el final, por difícil que fuera.
Sin embargo, la respuesta eductiva no es la única posible. También hay respuestas evolutivas. Según éstas, el equilibrio se consigue, no porque los jugadores piensan todo de antemano, sino como consecuencia de que los jugadores miopes ajustan su conducta por tanteo cuando juegan y se repiten durante largos períodos de tiempo.
Racionalizabilidad: es la forma que se comporta alguien bayesiano-racional cuando ha de tomar una decisión en situaciones donde el resultado de la decisión a tomar depende de sucesos inciertos para quien ha de tomarla. El o ella actúa como si dispusiera de una medida de probabilidad subjetivas a los sucesos de los que no está seguro.
En un juego finito de dos jugadores, ningún jugador sabe con seguridad que estrategia pura, incluso si el oponente mezcla, el resultado final será que se juega alguna estrategia pura, la cual terminará por utilizar el oponente. Un jugador bayesiano-racional, por tanto, asigna una probabilidad subjetiva a cada una de las alternativas posibles. Entonces el jugador escoge una estrategia que maximiza su pago esperado con respecto a estas probabilidades subjetivas. Por tanto, el o ella se comportan como si estuviera escogiendo una respuesta óptima a una de las estrategias mixtas del oponente, si la estrategia mixta para la que se elige una respuesta óptima.
La Teoría de Juegos da por supuesto que las creencias de un jugador sobre lo que un oponente hará depende de lo que el jugador sabe acerca del oponente. Sin embargo, no está ni mucho menos claro lo que debemos suponer acerca de lo que los jugadores saben de su oponente. La idea de racionalizabilidad se construye sobre la hipótesis de que por l menos debería ser conocimiento común que ambos jugadores son bayesianos-racionales.
Equilibrio Correlacionado: Aumann sugiere que deberíamos asumir que es "conocimiento común" que los jugadores comparten el mismo universo del discurso. Sugiere, además que los estados de este universo W se deben suponer completos. Estos significa que si usted alguna vez llega a saber que ha ocurrido con seguridad, entonces usted absolutamente todo lo que concebiblemente pudiera ser relevante para usted a la hora de tomar una decisión. La descripción de un estado, por tanto, debe especificar cada detalle del "mundo posible" que representa. Esto incluye no sólo como se comportan los jugadores, sino también cuáles son sus estados mentales. Ya que los jugadores son bayesianos-racionales, sus estados mentales se pueden resumir en dos cosas:
08. Comentarios generales:Bayesianismo: el Bayesianismo no requiere habilidades mentales excepcionales por parte de los jugadores. Estos revisan mecánicamente sus probabilidades subjetivas a medida que disponen de nueva información, y entonces deciden qué hacer por el método igualmente mecánico de maximizar su pago esperado dadas las creencias actuales.
Los bayesianos ingenuos piensan que no es necesario preguntarse de dónde salen las probabilidades a priori de los jugadores, o cómo saben estos cuáles son sus particiones de posibilidades, en particular, creen que la racionalidad bayesiana dota a quienes la hacen suya con la capacidad de coger del aire sus creencias subjetivas. Esta actitud lleva a bayesianos que son muy ingenuos a argumentar que la teoría de juegos es una pérdida de tiempo. Es indudablemente cierto que si no necesitáramos preocuparnos de por qué la gente cree en lo que cree, entonces las consideraciones sobre equilibrios se harían irrelevantes.
09. Juegos de suma cero de dos personas:Durante las dos décadas que siguieron a la segunda guerra mundial, uno de los progresos más interesantes de la teoría económica fue la teoría de los juegos y el comportamiento económico, publicada en un libro de este titulo bajo la autoridad conjunta de Jhon Von Neumann y Oskar Morgenstern. Actualmente, el consenso parece ser que la teoría de los juegos es más relevante al estudio de problemas comerciales específicos que a la teoría económica general, por que representa un enfoque único al análisis de las decisiones comerciales en condiciones de intereses competitivos y conflictivos.
El principal objetivo de la teoría de los juegos es determinar los papeles de conducta racional en situaciones de "juego" en las que los resultados son condicionales a las acciones de jugadores interdependientes. Un juego es cualquier situación en la cual compiten dos o más jugadores. El ajedrez y el póker son buenos ejemplos, pero también lo son el duopolio y el oligopolio en los negocios. La extensión con que un jugador alcanza sus objetivos en un juego depende del azar, de sus recursos físicos y mentales y de los de sus rivales, de las reglas del juego y de los cursos de acciones que siguen los jugadores individuales, es decir, sus estrategias. Una estrategia es una especificación de la acción que ha de emprender un jugador en cada contingencia posible del juego.
Se supone que, en un juego, todos los jugadores son racionales, inteligentes y están bien informados. En particular, se supone que cada jugador conoce todo el conjunto de estrategias existentes, no solo para él, sino también para sus rivales, y que cada jugador conoce los resultados de todas las combinaciones posibles de las estrategias.
Igualmente, en una gran variedad de juegos, el resultado es una variable aleatoria cuya distribución de probabilidades debe ser establecida para que pueda ser posible una solución para el juego. A este respecto, debe observarse que las decisiones de los jugadores interdependientes no se toman en un vacío y que los pagos resultantes de estas decisiones dependen de las acciones emprendidas por todos los jugadores. Esta interdependencia implica que puede ser inapropiado suponer que los pagos están siendo generados por un proceso probabilista invariante que no es afectado por el curso de acción que uno escoja. En otras palabras, la acción que emprende un jugador puede dictar los actos de otros jugadores o influir en la probabilidad de que se comporten en una forma particular. Esta potencialidad de posibles efectos en los resultados es la que distingue la toma de decisiones en conflictos y la toma de decisiones en un medio incierto.
La clase más sencilla de modelo de juego rigurosamente adversario, en el que los resultados posibles son calificados en orden opuesto por los jugadores. Entre esta clase, él más común es el juego de suma constante, en el que la suma de las ganancias de los jugadores es igual, cualesquiera que sea su distribución entre ellos. Un caso especial, y el único que consideraremos, de juegos de suma constante se llama juego de suma cero de dos personas.
10. Estrategias maximin y minimax:Dos compañías de autobuses, A y B, explotan la misma ruta entre dos ciudades y están enzarzadas en una lucha por una mayor parte del mercado. Puesto que la parte total del mercado es un 100 por 100 fijo, cada punto porcentual ganado por uno debe ser perdido por el otro. Se dice que tal situación es un juego de suma cero de dos personas por las razones obvias de que el juego es jugado por dos jugadores diametralmente opuesto y que la suma de las ganancias y perdidas es siempre cero.
Si se supone que la compañía A y la compañía B esta considerando las
tres mismas estrategias para ganar una mayor parte relativa del mercado como sigue:
1.a1 o b1: Sirve refrescos durante el viaje.
2.a2 o b2: Introduce autobuses con aire acondicionado.
3.a3 o b3: Anuncia diariamente en estaciones de televisión en las dos ciudades.Por comodidad, se supone que ante de comenzar el juego ambas compañías no están asiendo ningún esfuerzo especial y comparte por igual el mercado –50 por 100 cada una. Además, si se supone también que cada compañía no puede emplear mas de uno de estas actitudes o estrategias al mismo tiempo y que las tres estrategias tienen idénticos costos.
Por estos supuestos, hay un total de 3 x 3 = 9 combinaciones posibles de movimientos, y cada una es capas de afectar a la parte del mercado en una forma especifica. Por ejemplo, si A y B sirvan refrescos durante el viaje, se dice que A perdería 10 por 100 de la parte del mercado a favor de B, lo que puede indicar que los refrescos de B son mas para los gustos de los clientes, igualmente, si A anuncio y B, por ejemplo, sirve refrescos, se supone que A ganaría 20 por 100 del mercado en perjuicio de B; evidentemente, la publicidad en televisión parece ser más eficaz que servir refrescos.
Ahora, por cada una de las 9 combinaciones puede determinar ganancias o perdidas del mercado para A como se indica en la siguiente matriz de pagos.
b1 b2 b3 a1 -10 -11 -1 a2 9 -8 6 a3 20 -10 -13
11. Punto de silla de montar:El enfoque conservador a la lección de la mejor estrategia es suponer lo peor y actuar de conformidad con ello. Así según este enfoque y con referencia en la matriz de pagos. Si A decide sobre la estrategia a1, supondría que B escogerá la estrategia b2, reduciendo con ello el pago a1 para A aun valor mínimo o de seguridad de –11. Análogamente, los valores de seguridad para a2 y a3 son –8 y –3, respectivamente.
Obsérvese que los valores de seguridad para los distintos movimientos que puede hacer A son los mínimos de filas. Dados estos valores mínimos, hará bien en emplear aquella estrategia que da el máximo de estos valores de seguridad mínimos. En el ejemplo A debe adoptar a2 y aspira a un pago de –8 a B. Esta regla de decisión, que conduce a la elección del mayor de los valores mínimos en que puede resultan cada estrategia, se llama estrategia maximin.
La compañía B, según esta actitud conservadora, supondría que por cada una de sus acciones, la respuesta de A será tal que la ganancia de A en parte del mercado es la máxima posible. Por ejemplo, si B emplea la estrategia b1, supondría que A adoptara la estrategia a3, la cual dará la peor perdida posible para B. Análogamente, los peores pagos para b2 y b3 son –8 y –1, los máximos valores en las columnas 2 y 3,respectivamente.Asi, vemos que el máximo en cada columna es el peor pago por un movimiento correspondiente hecho por B. El mejor de estos peores pagos es claramente el valor mínimo de estas cifras mas altas. Esta cifra –8 en la columna 2, correspondiente a la estrategia b2 y el movimiento contrario a2. Por tanto, la emisión optima, llamada estrategia minimax de B, es b2.
Se puede observar según la regla maximin de A y la regla minimax de B el pago es –8. Esta cantidad se llama valor del juego es positivo, se dice que el juego es a favor de A: si negativo, favorece a B; y si cero, se dice que el juego es equitativo. La solución de nuestro problema da un pago de –8, que indica que el juego favorece a B por que B gana 8 por 100 del mercado a expensas de A.
12. Estrategia dominante:Se ha alcanzado ahora un punto en el que si A adopta estrategia maximin a2 su pago es exactamente igual al que B espera que obtenga A sí B emplea la estrategia minimax b2. Un lector puede poner en duda el acierto de tales reglas de decisión. Por ejemplo, ¿ por qué A no se esfuerza por ganar 20 por 100 de la parte del mercado empleando a3, en vez de perder 8 por 100 a favor de B empleando a2?. La respuesta es que, si A lo hiciera así B podría tomar b2 por lo que A podría perder 10 a 13 por 100 del mercado a favor de B, en vez de perder solo 8 por 100. Similarmente, puede arguirse que B debe adoptar b2 por lo que A podría perder 10 o 13 por 100 del mercado a favor de B, en pensas de A. Sin embargo, este pago solo es posible sí A hace el movimiento de a3.
En otro caso, la ganancia de B seria menor de 8. Argumentos similares usados en la "cautela" dictan que a2 y b2 son las mejores estrategias para A en B respectivamente, por que esta combinación ofrece a A y B una medida de seguridad. Esto es así por que el criterio de decisión maximin de A da a A la "máxima" parte del mercado que puede impedirse a B que reduzca más, y que la regla minimax de B ofrece B la "mínima" parte del mercado que puede impedirse a A que aumente más.
En otras palabras las estrategias maximin y minimax conducen a los dos jugadores del juego a situaciones en las que ningún jugador tiene razón o incentivo alguno para cambiar su posición. A no desea cambiar por que cuando B juega b2, el se encuentra mejor jugando a2 que a1 o a3. B no desea cambiar por que cuando A juega a2 se encuentra mejor jugando b2 que b1 o b3. Evidentemente, se ha alcanzado una situación de equilibrio.
El pago en tal punto de equilibrio es la solución minimax y se conoce como punto de silla de montar de la matriz de pagos en el sentido de que es el mínimo de sus datos de columna. Considerémosla solución del par de decisiones en nuestro ejemplo a2 y b2. Cuando A adopte a2 el pago se reduce de 9 a –8 y luego aumenta de –8 a -6. Cuando B escoge b2, su pago disminuye de –11 a –8 y luego aumenta de –8 a –10. El numero –8 en medio forma un valle cuando es visto desde la segunda fila forma una cordillera cuando es visto desde la segunda columna. La solución minimax semeja exactamente una silla de montar: de ahí el nombre de "punto en silla de montar", que es a la vez un mínimo, como un valle máximo, como una cordillera.
Es posible que pueda haber mas de un punto en silla de montar en la matriz de pagos de un juego. Si es así, los pagos correspondientes a los puntos en silla de montar es empleado para determinar movimientos óptimos para los dos jugadores se puede considerar el siguiente juego, por ejemplo:
Estrategia de B
b1 b2 b3 Mínimo de fila a1 2 -3 7 -3 a2 5 5 6 5º a3 1 4 -4 -4 Máximo de columna 5º 5º 7 Aquí se tienen dos puntos en silla de montar; uno corresponde a a2 y b1, y el otro corresponde a a2 y b2. Según el criterio minimax, el jugador A haría el movimiento a2. Al hacerlo, no importa si el jugador B emplea la estrategia b1 o b2, por que en cada caso B debe pagar a A una cantidad de, por ejemplo, 5 útiles.
También, puesto que el valor del juego en este ejemplo es positivo, se dice que el juego favorece A.
Se dice que un juego de suma cero de dos personas es rigurosamente determinado si existe un punto en silla de montar, por que ese punto en es una solución aceptada al juego de encontrar la mejor estrategia para cada uno de los dos jugadores.
13. Estrategia mixta:Se dice que un jugador posee una estrategia dominante si una estrategia particular es preferida a cualquier otra estrategia a disposición de el. Es posible que cada uno de los dos jugadores tenga estrategia dominante.
14. Modelo de formación de colas:Es una combinación de dos estrategias escogidas a azar, una cada vez, según determinadas probabilidades, en contraste con una estrategia pura que no contiene tales elementos de azar.
15. El modelo de cola de una sola estación:Modelos de formacion de colas basicos
El esfuerzo de A.K. Erlang por analizar la congestión de tráfico telefónico, con objeto de satisfacer la demanda de servicios surgida al azar del sistema telefónico automático de Copenhague en 1909,produjo una nueva teoría que ha llegado a conocerse como teoría de formación de cola o línea de espera. Esta teoría es uno de los instrumentos más valiosos de la ciencia de administración de empresas, por que muchos problemas de la gerencia pueden caracterizarse como problemas de "llegada y partida"
En los problemas de formación de cola, a menudo se habla de clientes, tales como personas que esperan la desocupación de líneas telefónicas, la espera de máquinas para ser reparadas y los aviones que esperan aterrizar y estaciones de servicios, tales como mesas en un restaurante, operarios en un taller de reparación, pistas en un aeropuerto, etc. Los problemas de formación de colas a menudo contienen una velocidad variable de llegada de clientes que requieren cierto tipo de servicio, y una velocidad variable de prestación del servicio en la estación de servicio.
Cuando se habla de líneas de espera, se refieren a las creadas por clientes o por las estaciones de servicio. Los clientes pueden esperar en cola simplemente por que los medios existentes son inadecuados para satisfacer la demanda de servicio; en este caso, la cola tiende a ser explosiva, es decir, a ser cada vez mas larga a medida que transcurre el tiempo. Las estaciones de servicio pueden estar esperando por que los medios existentes son excesivos en relación con la demanda de los clientes; en este caso, las estaciones de servicio podrían permanecer ociosas la mayor parte del tiempo. Los clientes puede que esperen temporalmente, aunque las instalaciones de servicio sean adecuadas, por que los clientes llegados anteriormente están siendo atendidos. Las estaciones de servicio pueden encontrar temporal cuando, aunque las instalaciones sean adecuadas a largo plazo, haya una escasez ocasional de demanda debido a un hacho temporal. Estos dos últimos casos tipifican una situación equilibrada que tiende constantemente hacia el equilibrio, o una situación estable.
En la teoría de la formación de colas generalmente se llama sistema a un grupo de unidades físicas, integradas de tal modo que pueden operar al unísono con una serie de operaciones organizadas. La teoría de la formación de colas busca una solución al problema de la espera prediciendo primero el comportamiento del sistema. Pero una solución al problema de la espera consiste en no solo en minimizar el tiempo que los clientes pasan en el sistema, sino también en minimizar los costos totales de aquellos que solicitan el servicio y de quienes lo prestan.
16. Nota sobre la regla de prioridad:Analíticamente, este modelo se construye con el siguiente conjunto de supuestos:
1. LLEGADA DE CLIENTE O INSUMO: Se supone que las llegadas se producen al azar y que la probabilidad de una llegada durante cualquier intervalo de tiempo de longitud fija permanece constante, independientemente de lo que ha sucedido anteriormente y de la longitud de la cola. En otras palabras se supone que las llegadas obedecen la ley de probabilidades de Poisson con una frecuencia media de llegadas, o promedio de llegadas, l , por unidad de tiempo. Aquí,l es igual para cualquier unidad de tiempo. Si se define de nuevo la unidad de tiempo, como en un cambio de un segundo a un minuto, por supuesto,l cambia su valor numérico apropiadamente. Su reciproca, 1/l es el promedio de unidades de tiempo entre dos llegadas sucesivas. Por esta hipótesis, la probabilidad de exactamente n en una unidad de tiempo se da por: Pn =ln e-l/ n!
2. DISCIPLINA DE COLA O REGLA DE PRIORIDAD: Cuando un cliente llega al sistema, generalmente ha de esperar antes de que se le preste servicio. Su partida es influida, entre otras cosas, por la disciplina de cola, la regla establecida por la cual los clientes que esperan en la cola son servidos. Si se supone vigente la regla acreditada por el tiempo de el primero que llega, el primero en ser servido. Nuestra regla también abarca el requisito de que ningún cliente del sistema partirá sin recibir servicio.
3. PRODUCCION: Este criterio se refiere al numero de estaciones de servicio y la distribución del tiempo de servicio.
4. FRECUENCIA DE SERVICIO: Se supone también que él número de clientes servidos por la única estación sigue la Ley de Poisson con el promedio de frecuencias de servicio representado como m .Por tanto: Pn = mn e-m / n! , es la probabilidad de n servicios por una unidad de tiempo. Se observa que 1/m es el tiempo medio de servicios de la variable aleatoria exponencial "tiempo de servicio.Cuando se satisfacen estos supuestos, se tiene un modelo matemático para problemas de formación de colas de una sola estación, el primero en llegar, el primero en ser servido.
17. Modelo de cola de una estación múltiple:Esta regla es muy apropiada si la " injusticia" será resentida, o si los clientes son de igual importancia y requieren en promedio la misma cantidad de servicio. Pero en muchas situaciones puede haber fuertes razones para la practica de reglas de prioridad. Por esta regla de prioridades tenemos, en realidad, dos colas: una para los clientes rápidos y otra para los lentos.
La reducción relativa del tiempo de espera medio por nuestra nueva disciplina de cola depende de tres factores:
1. El parámetro de utilización.
2. La razón del tiempo de servicio medio de los clientes rápidos a la de los clientes lentos. Sea s1 el tiempo medio de servicio para clientes rápidos y s2 para clientes lentos; entonces, podemos designar esta razón por R= s1/s2 que obviamente varia de 0 a1.
3. La fracción F del numero total de clientes rápidos, f, al número total de clientes, n; es decir, F= f /n. Nuevamente F varía de 0 a 1.
18. Simulación de Monte Carlo:Existe un modelo de cola de estación de servicio múltiple cuando los clientes de una sola cola pueden ser servidos por mas de una estación de servicio igualmente bien. Aquí, todas las k, k >= 2, estaciones de servicio tienen idéntica capacidad de servicio, y la cola es única en el sentido de que una línea de espera alimenta a todas las estaciones como en los sistemas de " tome un numero" de las tiendas al por menor.
19. Tamaño óptimo de un equipo de servicio:La simulación Monte Carlo es la amiga de los matemáticos no refinados. Para comprenderla y usarla, se necesita poca capacitación matemática. Puede ser adaptada fácilmente a cualquier situación, con tal que las alternativas puedan ser especificadas cuantitativamente y que los datos requeridos puedan ser calculados con aceptable confianza.
Monte Carlo es un proceso de resolver un problema simulando datos originales con generadores de números al azar. Su aplicación sólo requiere dos cosas básicas:
1. Se debe tener un modelo que represente una imagen de realidad tal como lo vemos. El modelo en este caso no es mas que la distribución por probabilidades de la variable que se considera. El mérito importante de la simulación es que puede ser aplicada aunque las distribuciones de probabilidades no puedan ser expresadas explícitamente en cualquiera de las formas teóricas, tales como aquellas que han sido presentadas en este texto. Todo lo que se requiere es una tabla o un gráfico de una distribución de una variable directa o, indirectamente, por el uso de registros pasados.
2. Es un mecanismo para simular el modelo. El mecanismo pudo ser cualquier generador de números al azar, tal como un par de dados, un puntero giratorio, una rueda de ruleta, una tabla de dígitos al azar o una computadora de alta velocidad apropiadamente instruida.
3. El método Monte Carlo es para simular, mediante procedimientos al azar, situaciones del mundo real de naturaleza probabílistica.
20. Conclusiones:El tamaño optimo de un equipo de servicio se considera un segundo ejemplo de simulación Monte Carlo. Una nueva empresa industrial que ha estado en el negocio por espacio de 3000 horas de operación, tiene en uso un gran numero de máquinas idénticas. Tiene una sola estación de servicio con un equipo de operarios, La reparación de cualquier maquina es un esfuerzo conjunto del equipo. Cuando la estación de servicio es ocupada por una maquina y ocurren otras descomposturas, se crea una línea de espera. Se han registrado cuidadosamente durante las 3000 horas pasadas datos sobre él numero de computadoras por hora y él número de reparaciones que requieren varios periodos de tiempo para prestarles servicio. Las probabilidades de estos dos conjuntos de hechos basados en datos del pasado se indican en los cuadros 1 y 2, respectivamente.
cuadro 1, datos sobre descomposturas
Descomposturas por horas Probabilidad Probabilidad Acumulativa Intervalo de
números al
azar de 3 dígitos0 0.900 0.900 000-899 1 0.090 0.990 900-989 2 0.008 0.998 990-997 3 0.002 1.000 998-999
cuadro 2, datos sobre tiempo requerido para reparacion
HORAS DE REPARACIÓN PROBABILIDAD PROBABILIDAD ACUMULATIVA INTERVALOS DE
NÚMEROS AL
AZAR DE 3 DÍGITOS1 0.251 0.251 000-250 2 0.375 0.626 251-625 3 0.213 0.839 626-838 4 0.124 0.963 839-962 5 0.037 1.000 963-999 Se considera que los dos conjuntos de hechos son estadísticamente independientes. Una prueba Chi Cuadrado sobre las frecuencias absolutas conjuntas mostraría si la independencia estadística es razonable.
Lo primero que debemos hacer es asignar intervalos de números al azar a descomposturas de maquinas por hora y a números de horas requeridos para reparar las máquinas. Estos intervalos se dan en las ultimas columnas de los cuadros 1 y 2. Obsérvese que en ambos casos los intervalos de números al azar asignados n proporcionales a las probabilidades de ocurrencia de los hechos respectivos.
. La Teoría de Juegos consiste en razonamientos circulares, los cuales no pueden ser evitados al considerar cuestiones estratégicas. La intuición no educada no es muy fiable en situaciones estratégicas, razón por la que se debe entrenar. La Teoría de Juegos fue creada por Von Neumann y Morgenstern en 1944. Otros habían anticipado algunas ideas. Los economistas Cournot y Edgeworth fueron particularmente innovadores en el siglo XIX. Otras contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo.
. A principio de los años cincuenta, en una serie de artículos muy famosa el matemático John Nash rompió dos de las barreras que Von Neumann y Morgenstern se habían auto-impuesto.
. La Teoría de Juegos actualmente tiene muchas aplicaciones, entre las disciplinas tenemos: la Economía, la Ciencia Política, la Biología y la Filosofía.
. Según el Filósofo Hobbes un hombre se caracteriza por su fortaleza física, sus pasiones, su experiencia y su razón. Hay dos tipos de respuesta, la del tipo educativo, los jugadores suponen que tienen al equilibrio como el resultado de razonar cuidadosamente y un segundo tipo de respuestas, las evolutivas, según éstas, el equilibrio se consigue, no porque los jugadores piensan todo de antemano, sino como consecuencia de que los jugadores miopes ajustan su conducta por tanteo cuando juegan y se repiten durante largos períodos de tiempo.
. Racionabilidad: es la forma que se comporta alguien bayesiano-racional cuando ha de tomar una decisión en situaciones donde el resultado de la decisión a tomar depende de sucesos inciertos para quien ha de tomarla. Los jugadores son bayesianos-racionales, sus estados mentales se pueden resumir en dos cosas: lo que saben y lo que creen.
. Las estrategias maximin y minimax conducen a los dos jugadores del juego a situaciones en las que ningún jugador tiene razón o incentivo alguno para cambiar su posición. Se dice que un jugador posee una estrategia dominante si una estrategia particular es preferida a cualquier otra estrategia a disposición de él.
. Estrategia mixta es una combinación de dos estrategias escogidas a azar, una cada vez, según determinadas probabilidades, en contraste con una estrategia pura que no contiene tales elementos de azar.
Felipe Costales
felcos@cantv.net