2 × 2 Zero-Sum Games with Commitments and Noisy Observations
- Creators
- Sun, Ke
- Perlaza, Samir
- Jean-Marie, Alain
- Others:
- Network Engineering and Operations (NEO ) ; Inria Sophia Antipolis - Méditerranée (CRISAM) ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
- Department of Electrical and Computer Engineering [Princeton] (ECE) ; Princeton University
- Laboratoire de Géométrie Algébrique et Applications à la Théorie de l'Information (GAATI) ; Université de la Polynésie Française (UPF)
- Action Exploratoire Inria: Information and Decision Making (IDEM)
- Inria - Sophia Antipolis
Description
In this report, 2 × 2 zero-sum games are studied under the following assumptions: (1) One of the players (the leader) commits to choose its actions by sampling a given probability measure (strategy); (2) The leader announces its action, which is observed by its opponent (the follower) through a binary channel; and (3) the follower chooses its strategy based on the knowledge of the leader's strategy and the noisy observation of the leader's action. Under these conditions, the equilibrium is shown to always exist. Interestingly, even subject to noise, observing the actions of the leader is shown to be either beneficial or immaterial for the follower. More specifically, the payoff at the equilibrium of this game is upper bounded by the payoff at the Stackelberg equilibrium (SE) in pure strategies; and lower bounded by the payoff at the Nash equilibrium, which is equivalent to the SE in mixed strategies. Finally, necessary and sufficient conditions for observing the payoff at equilibrium to be equal to its lower bound are presented. Sufficient conditions for the payoff at equilibrium to be equal to its upper bound are also presented.
Abstract (French)
Dans ce rapport, les jeux à somme nulle 2 × 2 sont étudiés sous les hypothèses suivantes : (1) L'un des joueurs (le meneur) s'engage à choisir ses actions en échantillonnant une mesure de probabilité donnée (stratégie) ; (2) Le meneur annonce son action, qui est observée par son adversaire (le suiveur) à travers un canal binaire ; et (3) le suiveur choisit sa stratégie en fonction de la connaissance de la stratégie du meneur et de l'observation bruitée de l'action du meneur. Dans ces conditions, on montre que l'équilibre existe toujours. Fait intéressant, même sujette au bruit, l'observation des actions du leader s'avère soit bénéfique, soit immatérielle pour le suiveur. Plus précisément, la récompense à l'équilibre de ce jeu est majorée par la récompense à l'équilibre de Stackelberg (SE) en stratégies pures, et minorée par la récompense à l'équilibre de Nash, qui équivaut au SE en stratégies mixtes. Enfin, les conditions nécessaires et suffisantes pour observer que la récompense à l'équilibre est égale à sa borne inférieure sont présentées. Les conditions suffisantes pour observer que la récompense à l'équilibre est égale à sa borne supérieure sont aussi présentées.
Additional details
- URL
- https://hal.science/hal-03838009
- URN
- urn:oai:HAL:hal-03838009v2
- Origin repository
- UNICA