Published March 2021
| Version v1
Report
Stationary Strong Stackelberg Equilibrium in Discounted Stochastic Games
Contributors
Others:
- Département d'Informatique [Bruxelles] (ULB) ; Faculté des Sciences [Bruxelles] (ULB) ; Université libre de Bruxelles (ULB)-Université libre de Bruxelles (ULB)
- Integrated Optimization with Complex Structure (INOCS) ; Inria Lille - Nord Europe ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université libre de Bruxelles (ULB)-Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL) ; Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)
- Facultad de Ciencias Exactas, Ingenieria y Agrimensura [Rosario] (FCEIA) ; Universidad Nacional de Rosario [Santa Fe]
- Network Engineering and Operations (NEO ) ; Inria Sophia Antipolis - Méditerranée (CRISAM) ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
- Departamento de Ingenieria Industrial [Santiago] (DII)
- Victor Bucarey has been partially supported by the Fonds de la Recherche Scientifique-FNRS under Grant(s) n° PDR T0098.18.
- Inria
Description
In this work we focus on Stackelberg equilibria for discounted stochasticgames. We begin by formalizing the concept of Stationary Strong Stackelberg Equlibrium(SSSE) policies for such games. We provide classes of games where the SSSE exists, andwe prove via counterexamples that SSSE does not exist in the general case. We definesuitable dynamic programming operators whose fixed points are referred to as FixedPoint Equilibrium (FPE). We show that the FPE and SSSE coincide for a class of gameswith Myopic Follower Strategy. We provide numerical examples that shed light on therelationship between SSSE and FPE and the behavior of Value Iteration, Policy Iterationand Mathematical programming formulations for this problem. Finally, we present asecurity application to illustrate the solution concepts and the efficiency of the algorithmsstudied in this article.
Abstract (French)
Dans cet article, nous nous focalisons sur les équilibres de Stackelbergpour pour les jeux stochastiques actualisés. Nous commençons par formaliser le conceptd'équilibre fort de Stackelberg en politiques stationnaires (Strong Stationary StackelbergEquilibria, SSSE) pour ces jeux. Nous exhibons des classes de jeux pour lesquels le SSSEexiste et nous montrons par des contre-exemples que les SSSE n'existent pas dans le casgénéral. Nous définissons des opérateurs de programmation dynamique appropriés pour ceconcept dont les points fixes sont nommés FPE (Fixed Point Equilibria). Nous montronsque le FPE et le SSSE coïncident pour la classe de jeux stochastiques avec stratégiedu "follower" myope (Myopic Follower Strategy, MFS). Nous montrons des exemplesnumériques qui éclairent la relation entre SSSE et FPE ainsi que le comportement desalgorithmes Value Iteration, Policy Iteration, et la formulation par ProgrammationMathématique de ce problème. Finalement, nous décrivons une application dans ledomaine de la sécurité pour illustrer les concepts de solution et l'efficacité des algorithmesintroduits dans cet article.Additional details
Identifiers
- URL
- https://hal.inria.fr/hal-02144095
- URN
- urn:oai:HAL:hal-02144095v3
Origin repository
- Origin repository
- UNICA