np.random.choices的使用

在看莫烦python的RL源码时，他的DDPG记忆库Memory的实现是这样写的：

class Memory(object):

    def __init__(self, capacity, dims):

        self.capacity = capacity

        self.data = np.zeros((capacity, dims))

        self.pointer = 0

    def store_transition(self, s, a, r, s_):

        transition = np.hstack((s, a, [r], s_))

        index = self.pointer % self.capacity  # replace the old memory with new memory

        self.data[index, :] = transition

        self.pointer += 1

    def sample(self, n):

        assert self.pointer >= self.capacity, 'Memory has not been fulfilled'

        indices = np.random.choice(self.capacity, size=n)

        return self.data[indices, :]

其中sample方法用assert断言pointer >= capacity，也就是说Memory必须满了才能学习。

我在设计一种方案，一开始往记忆库里存比较好的transition(也就是reward比较高的)，要是等记忆库填满再学习好像有点浪费，因为会在填满之后很快被差的transition所替代，甚至好的transition不能填满Memory，从而不能有效学习好的经验。

此时就需要关注np.random.choice方法了，看源码解释：

def choice(a, size=None, replace=True, p=None): # real signature unknown; restored from __doc__

    """

    choice(a, size=None, replace=True, p=None)

            Generates a random sample from a given 1-D array

                    .. versionadded:: 1.7.0

            Parameters

            -----------

            a : 1-D array-like or int

                If an ndarray, a random sample is generated from its elements.

                If an int, the random sample is generated as if a were np.arange(a)

            size : int or tuple of ints, optional

                Output shape.  If the given shape is, e.g., ``(m, n, k)``, then

                ``m * n * k`` samples are drawn.  Default is None, in which case a

                single value is returned.

            replace : boolean, optional

                Whether the sample is with or without replacement

            p : 1-D array-like, optional

                The probabilities associated with each entry in a.

                If not given the sample assumes a uniform distribution over all

                entries in a.

            Returns

            --------

            samples : single item or ndarray

                The generated random samples

主要第一个参数为ndarray，如果给的是int，np会自动将其通过np.arange(a)转换为ndarray。

此处主要关注的是，a(我们使用int)< size时，np会怎么取？

上代码测试

import numpy as np

samples = np.random.choice(3, 5)

print(samples)

输出：

[2 1 2 1 1]

所以，是会从np.array(a)重复取，可以推断出，np.random.choice是“有放回地取”（具体我也没看源码，从重复情况来看，至少a<size时是这样的）

然后我分别测试了np.random.choice(5, 5)、np.random.choice(10, 5)等。多试几次会发现samples中确实是会有重复的。：

import numpy as np

samples = np.random.choice(10, 5)

print(samples)

[3 4 3 4 5]

np.random.choices的使用的更多相关文章

怎么理解np.random.seed()?
在使用numpy时,难免会用到随机数生成器.我一直对np.random.seed(),随机数种子搞不懂.很多博客也就粗略的说,利用随机数种子,每次生成的随机数相同. 我有两个疑惑:1, 利用随机数种子 ...
对抗生成网络-图像卷积-mnist数据生成(代码) 1.tf.layers.conv2d(卷积操作) 2.tf.layers.conv2d_transpose(反卷积操作) 3.tf.layers.batch_normalize(归一化操作) 4.tf.maximum(用于lrelu) 5.tf.train_variable(训练中所有参数) 6.np.random.uniform(生成正态数据
1. tf.layers.conv2d(input, filter, kernel_size, stride, padding) # 进行卷积操作参数说明:input输入数据, filter特征图的 ...
NP：建立可视化输入的二次函数数据点集np.linspace+np.random.shuffle+np.random.normal
import numpy as np import matplotlib.pyplot as plt def fix_seed(seed=1): #重复观看一样东西 # reproducible np ...
np.random.rand均匀分布随机数和np.random.randn正态分布随机数函数使用方法
np.random.rand用法觉得有用的话,欢迎一起讨论相互学习~Follow Me 生成特定形状下[0,1)下的均匀分布随机数 np.random.rand(a1,a2,a3...)生成形状为( ...
np.random.choice方法
np.random.choice方法觉得有用的话,欢迎一起讨论相互学习~Follow Me def choice(a, size=None, replace=True, p=None) 表示从a中随 ...
numpy中的np.random.mtrand.RandomState
1 RandomState 的应用场景概述在训练神经网络时,苦于没有数据,此时numpy为我们提供了 “生产” 数据集的一种方式. 例如在搭建神经网络(一)中的 4.3 准备数据集章节中就是采用n ...
np.random.normal()正态分布
高斯分布的概率密度函数 numpy中 numpy.random.normal(loc=0.0, scale=1.0, size=None) 参数的意义为: loc:float 概率分布的均值,对应着整 ...
np.random.randn()、np.random.rand()、np.random.randint()
(1)np.random.randn()函数语法: np.random.randn(d0,d1,d2……dn) 1)当函数括号内没有参数时,则返回一个浮点数: 2)当函数括号内有一个参数时,则返回秩 ...
np.random.random()系列函数
1.np.random.random()函数参数 np.random.random((1000, 20)) 上面这个就代表生成1000行 20列的浮点数,浮点数都是从0-1中随机. 2.numpy.r ...

随机推荐

IDEA安装及默认配置习惯配置(二)
安装完后,接下来配置Idea使用习惯. 一.基本使用 1.字体设置 2.修改编码模式 3.显示行号和方法分割线 4. 格式化代码时候多行空行合并为1行 5.代码提示不区分大小写 6.自动导包设置 7. ...
三角形示例（兼容IE6）
html代码:  <div class="sanjiao"></div> css代码: .sanjiao{ width ...
class类 - static
不需要实例化类,即可直接通过该类来调用的方法,即称之为"静态方法".将类中的方法设为静态方法也很简单,在方法前加上static关键字即可.这样该方法就不会被实例继承! class ...
远程调用cmd更新本地jar
最近遇到一个项目需求需要实现远程更新,但是本地项目无法更新自己,这让博主很是头疼,既然自己无法更新自己的话,那就自建新的项目,通过本地项目来调用新项目接口来更新本地项目. 代码如下: /** * 重启 ...
drunk_admin_hacking_challenge靶机之旅？
注: 只是记录本人玩的时候发现的新奇点如果你也想玩且看了这篇文章还是不会,请联系gg 靶机下载地址 https://www.vulnhub.com/entry/drunk-admin-web-h ...
Android ANR总结
1.ANR定义 ANR的全称是application not responding,是指应用程序未响应,Android系统对于一些事件需要在一定的时间范围内完成,如果超过预定时间未能得到有效响应或者响 ...
一步步用ABAP Development Tools连接SAP云平台上的ABAP编程环境
使用ABAP Development Tools的项目创建向导: New->ABAP Cloud Project: Service Instance Connection,选择SAP Cloud ...
【Hibernate】二级缓存及查询缓存
一.Hibernate的二级缓存 1.1 类缓存区特点缓存的是对象的散装的数据. 图一 Hibernate的二级缓存的散装数据 1.2 集合缓存区的特点: 缓存的是对象的id.需要依赖类缓冲区的配置 ...
面试想拿20K,HR说你只值10K,这个时候你该怎样回答或者反驳
正确的做法是: 不动声色,继续跟HR谈下去.把面试流程走完,并且争取拿到这个10K的offer. 这里有一个小技巧: 如果拿到offer,礼貌地跟HR表示感谢,不过不要马上入职.可以找个由头,比方说自 ...
sql注入原理，利用与防护
一.sql注入原理注入攻击的本质就是把用户输入的数据当作代码来执行.所以注入攻击有两个必要条件 1.用户能够控制的输入. 2.原本程序要执行的代码,拼接了用户输入的数据. 二.sql注入分类按照请 ...

np.random.choices的使用

np.random.choices的使用的更多相关文章

随机推荐

热门专题