Please Call me 小强

强化学习之路一 QLearning 算法

Q-Learning算法理论 Q-Learning是一种强化学习算法，用于学习在给定状态下采取不同行动的最佳策略。其公式如下： \(Q(s,a) \leftarrow (1 - \alpha) \cdot Q(s,a) + \alpha \cdot (r + \gamma \cdot \max_{a'…