G-2025-07
Asymptotic normality of cumulative cost in linear quadratic regulators
, et référence BibTeX
Le théorème central limite est un résultat fondamental en théorie des probabilités qui caractérise la distribution de l'écart par rapport à la moyenne dans la loi des grands nombres. Un comportement de distribution similaire apparaît dans d'autres cadres tels que l'estimation du maximum de vraisemblance, l'estimation des moindres carrés et l'approximation stochastique. Dans cet article, nous établissons un théorème central limite pour le coût cumulatif par étape engendré par la politique optimale dans les régulateurs linéaires quadratiques en utilisant les premiers principes. Notre technique de preuve repose sur une décomposition du coût cumulatif en utilisant un argument de complétion du carré, les propriétés de la séquence de bruit à densité uniforme, et un théorème central limite pour les séquences de différences martingales.
Paru en janvier 2025 , 12 pages
Publication
Document
G2507.pdf (380 Ko)