乐聚社区

标题: 强化学习随机策略之高斯似然数原理与代码实现 [打印本页]

作者: 草莓干    时间: 2020-12-17 15:25
标题: 强化学习随机策略之高斯似然数原理与代码实现
本帖最后由 草莓干 于 2020-12-17 15:25 编辑

一、原理介绍

使用随机策略有两个关键点


1、什么是多元高斯分布?

在多元高斯分布中,当协方差矩阵 ∑ 只有在对角元素非零,而其余元素为 0时,成为对角高斯分布。


多元高斯分布(Multivariate Gaussian Distribution)是一元高斯分布的在向量形式上的推广,其中向量的均值为,协方差矩阵为,概率密度函数表示为:

(, 下载次数: 255)