作者:YJLAugus 博客: https://www.cnblogs.com/yjlaugus 项目地址:https://github.com/YJLAugus/Reinforcement-Learning-Notes,如果感觉对您有所帮助,烦请点个Star. MDP背景介绍 Random Variable 随机变量(Random Variable),通常用大写字母来表示一个随机事件.比如看下面的例子: \(X\): 河水是咸的 \(Y\): 井水是甜的 很显然,\(X\), \(Y\)两个随…