2005-(I)-Game Theory (Spieltheorie ) - web publication at docplayer
http://docplayer.org/user/35716213/
Spieltheorie Vortrag im Rahmen des Schwingungsphysikalischen Kolloquiums Drittes Physikalisches Institut (DPI) Ireneusz (Irek) Iwanowski 20. Januar 2005
2 Motivation Was ist das Wesen der Spieltheorie? Die Spieltheorie beschäftigt sich mit der Analyse von Handlungsstrategien in Systemen mit vorgegebenen Regeln. John von Neumann Nash-Gleichgewicht John Nash, John C. Harsanyi, Reinhard Selten // Plato v.chr. Robert Axelrod John Maynard Smith
3 Überlegungen von Plato I Szenario: eine Armee wartet darauf, den Angriff einer feindlichen Armee abzuwehren wir, die Betrachter, analysieren mögliche Gedankenabläufe eines Soldaten 1. bei möglichen Sieg, weglaufen - bei möglicher Niederlage erst recht!!! desertieren 2.
4 Überlegungen von Plato II Fazit: Je mehr Soldaten glauben, die Schlacht würde verloren, desto größer ist deren Initiative, sich in Sicherheit zu bringen und je mehr sie glauben, die Schlacht würde ohne deren persönliches Engagement gewonnen werden, umso weniger Grund haben sie zu bleiben und zu kämpfen. Wenn jeder Soldat diese Art der Überlegung von anderen Soldaten erwartet, wird sehr schnell Panik unter den Soldaten ausbrechen und der Gegner entscheidet den Angriff zu seinen Gunsten. Lösung des Problems in der Realität? z.b.: Strafen für Deserteure, Eliminierung der Fluchtmöglichkeiten für eigene Soldaten (Die Landung von Cortez in Mexiko)
5 Formalismus der Spieltheorie I Definition des Spiels Ein Spiel besteht aus: { n} einer Menge von Spielern N = 1,...,, für jeden Spieler i N einer Menge von Strategien S, ( ) für jeden Spieler i N einer Auszahlungsfunktion π s,..., s, die abhängt von den gewählten Strategien aller Spieler: ( ) s1 s n,..., nennt man ein Strategieprofil. i i 1 n
6 Formalismus der Spieltheorie II Nichtkooperative und kooperative Spiele kooperative Spiele Es besteht die Möglichkeit, bindende Verträge einzugehen nichtkooperative Spiele Es ist unmöglich, bindende Verträge einzugehen Spieltheorie und Rationalität Kommunikation nicht ausgeschlossen, die eventuelle Verletzung getroffener Verabredungen ist nicht einklagbar!!! Die zentrale Annahme in der Spieltheorie ist die Rationalität: 1. jeder Entscheidungsträger verfolgt ein gegebenes Ziel, 2. er berücksichtigt dabei sämtliche relevanten Informationen, die ihm zur Verfügung stehen, insbesondere sein Wissen oder seine Erwartungen über das Verhalten anderer Entscheidungsträger.
7 Das Gefangenendilemma I Kronzeugen-Regel (USA und Italien) Szenario: Zwei Gefangene Bob und Sam werden verdächtigt, gemeinsam eine Straftat begangen zu haben. Die Höchststrafe für das Verbrechen beträgt 15 Jahre. derjenige, der redet (während der andere schweigt), wird in die Freiheit entlassen der andere erhält 15 Jahre wenn beide dichthalten, erhält jeder 2 Jahre (unerlaubter Waffenbesitz) wenn beide gestehen, erhält jeder 10 Jahre { } Spieler N = 1, 2 Strategien S = S = 1 2 { reden, schweigen} Ziel: Gewinnoptimierung Was ist die beste Strategie für Bob? Auszahlungsfunktion in Form einer sog. Payoff-Matrix
8 Das Gefangenendilemma II Payoff-Matrix Sam Bob schweigen (kooperieren) reden (defektieren) schweigen (kooperieren) (-2,-2) (0,-15) reden (defektieren) (-15,0) (-10,-10) Das Dilemma (optimale Strategie für Bob?): s1 r2 s2 r2 (a,a) (b,c) (c,b) (d,d) Bedingung c>a>d>b Fall: Sam schweigt. Schweigt Bob ebenfalls, so wird er 2 Jahre inhaftiert. Redet er, wird er freigesprochen. Es ist für Bob also besser zu reden. Fall: Sam redet. Schweigt Bob, so wird er 15 Jahre inhaftiert. Redet er, wird er nur 10 Jahre inhaftiert. Es ist für Bob also besser zu reden.
9 Das Gefangenendilemma III Fazit: Es ist für Bob in jedem Fall besser zu reden. Die Strategie Reden ist eine strikt dominante Strategie (analog für Sam). Strategie s von Spieler 1 ist dominant, wenn sie die 1 ( s s ) Auszahlung π, maximiert, unabhängig davon, welche Strategie Spieler 2 wählt. (Analog für Spieler 2.) "reden" also defektieren ist eine dominante Strategie für beide Spieler
10 Wiederholtes Gefangenendilemma Das bisherige Gefangendilemma war ein Spiel in der sog. Normalform. Das heißt, Entscheidungen werden simultan getroffen. Es gibt auch sequentielle Spiele. Hier müssen die Spieler Entscheidungen nacheinander treffen. Bsp. Wiederholtes Gefangendilemma Man hat die Möglichkeit auf ein Defektieren (reden) zu reagieren (bestrafen). Analyse durch Rückwärtsinduktion: egal was in der 1. Periode passiert, in der 2. Periode gibt es ein einziges Nash-Gleichgewicht( reden,reden) da das Spiel in der 2. Periode klar ist, sieht die 1. Periode jetzt aus wie eine letzte Periode. einzige Lösung für die erste Periode: defektieren Sam kooperieren(schweigen) defektieren(reden) mehrmals Bob defektieren(reden) Bob defektieren(reden) Rückwärtsinduktion (Rationalität)
11 Das Nash-Gleichgewicht Man bezeichnet die Strategiekombination (reden/reden) als Nash-Gleichgewicht. * Ein Nash-Gleichgewicht ist eine Strategie-Kombiation s, bei der jeder Spieler eine optimale Strategie wählt bei gegebener optimaler Strategie des anderen Spielers. B B 1 B 2 B 3 Bsp. A 1 10/10 0/6 2/2 A A 2 15/0 5/5 4/4 A 3 3/5 7/8 6/6 Wählt Spieler B 2 so ist für Spieler A 3 optimal und umgekehrt. Kein Spieler kann sich durch Wahl einer anderen Strategie verbessern. In diesem Fall wird sich kein Spieler bewegen Am Spielfeld herrscht ein Gleichgewicht. Das Strategiebündel A1/B1 wäre zwar für beide Spieler vorteilhafter, wäre aber kein Gleichgewicht. Der Spieler A könnte sich durch Veränderung (Wahl von A2) verbessern.
12 Ein Spiel ohne Nash-Gleichgewicht Elfer-Schiessen TW L TW R SP L 0/1 1/0 SP R 1/0 0/1 Triff der Schütze beim Elfer-Schiessen ins Tor, bekommt er einen Punkt der Tormann kriegt nichts. Hält der Tormann den Schuss, so erhält er einen Punkt und der Schütze geht leer aus. Wie leicht gezeigt werden kann, gibt es keine Situation, welche für beide Schütze wie Tormann akzeptabel ist.
13 Evolutionäre Spieltheorie Kampf der Geschlechter Szenario: Wir gehen davon aus, dass Weibchen und Männchen möglichst erfolgreich ihre Gene weitervererben wollen. Strategie der Männchen (flatterhaft zu sein) Gegenstrategie der Weibchen (spröde zu sein) oder (und) Strategie der Männchen (treu zu sein) Gegenstrategie der Weibchen (willig zu sein) treue Männchen flatterhafte Männchen willige Weibchen spröde Weibchen sind zur einer langen Verlobungszeit bereit und betreuen den Nachwuchs wollen nur rasche Paarung und verschwinden anschließend sind zur raschen Paarung bereit bestehen auf eine lange Verlobungszeit vor der Paarung
14 Kampf der Geschlechter I Die Regeln: Jedes erfolgreich gezeugte (und aufgezogene) Kind bedeutet für die Eltern +30 Punkte (+15 für jeden), vorhergegangene Verlobungszeit (-6), die Brutpflege(-20) Bsp.: treues Männchen und sprödes Weibchen: 0,5*( )=+2 Payoff-Matrizen Weibchen willig Weibchen spröde Männchen treu Männchen flatterhaft Männchen treu 5 2 Weibchen willig 5-5 Männchen 15 0 Weibchen 2 0 flatterhaft spröde
15 Kampf der Geschlechter II x 1 x y 2 1 x1 + x2 = 1 Es sei nun der Anteil jener Männchen, welche die Strategie treu spielen, flatterhaft ; sind dann die willigen Weibchen und y 2 die spröden. Es gilt und y1 + y2 = 1. Die Auszahlung für ein treues Männchen hängt von den Weibchen ab und beträgt: ( ) P treu = 5y + 2y ( ) ( ) ( ) = die andern erhalten P flatterhaft = 15y P willig = 5x 5x P spröde 1 2 x 1 1 Eine höhere Auszahlung ist nun mit einer Begünstigung der Gene für den zugehörigen Spieler zu deuten. Daher existiert ein Gleichgewicht: ( ) = P( flatterhaft ) ( ) = P( spröde) P treu P willig Dies gilt dann wenn: 5/8 treue Männchen und 1/6 willige Weibchen p(5/8,3/8), q(5/6,1/6)
16 Kampf der Geschlechter III Der Weg zu einer Differentialgleichung für asymmetrische Konflikte Die Auszahlungstabelle für die Männchen sei nun eine 2x2-Matrix A, und für die Weibchen sei B. Die mittlere Auszahlung ist mit P(treu), P(flatterhaft), P(i) festgelegt: P(i) kann man schreiben als: ( ) = ( ), = 1 ( ) oder = 2 ( ) mit = ( 1, 2 ) i ( ) = ( ), = 1 ( ) oder = 2( ) mit x = (, ) P i Ay i treu i flatterhaft y y y P j By j willig j spröde x x i 1 2 dx dt i dyi = x ( Ay) xay und = y ( Bx) ybx dt i i i i
17 Kampf der Geschlechter IV Lösung der Differentialgleichung A B und dx dt dy = x x y = y y + x dt ( 1 )( 2 12 ) und ( 1 )( 5 8 ) V(x,y) = + dx + dy x 1 x y 1 y x (, ) = 5ln + 3ln ( 1 ) + 2ln + 10ln ( 1 ) V x y x x y y y
18 Kampf der Geschlechter V Diskussion des Fixpunktes (evolutionsstabil oder nicht?) Der Fixpunkt kann in einem großzügigeren Sinne als stabil bezeichnet werden (für alle Bahnen in einer Umgebung, U, um den Fixpunkt existiert eine weitere Umgebung, V, welche sie nicht verlassen können). V(x,y) y (5/8,1/6) x y x
19 Zusammenfassung und Ausblick Spieltheorie erwies sich als ein hervorragendes Werkzeug in verschiedenen Bereichen der Humanund der Naturwissenschaften. Wirtschaft, Biologie, Soziologie, Psychologie, Politologie, Computerwissenschaften (KI) und Militärstrategien, kommen in unserer heutigen Welt ohne sie nicht mehr aus.. Es stellt sich die Frage nach Anwendungen innerhalb der Physik. Neue Anwendung der Spieltheorie auf die Quantenmechanik: Quantenteleportation, Quantenkommunikation, Quantenkryptographie und Quantencomputer