1. 问题

给定一个单链表,随机返回一个结点,要求每个结点被选中的概率相等。

2. 思路

在一个给定长度的数组中等概率抽取一个数,可以简单用随机函数random.randint(0, n-1)得到索引来抽取。

本题是给定了链表,当然也好做,可以事先遍历一次求长度,每次要取的时候随机求索引,然后遍历一次。

时间复杂度O(n),空间复杂度O(1)

或者事先把数据放到数组中,每次要取的时候随机求索引,然后直接取到对应的数。

时间复杂度O(1),空间复杂度O(n)

(延伸一下)如果对于长度未知,会不断增加的数据流呢?可以使用蓄水池采样(Reservoir Sampling)的方法。如果我们要从n个数(这个n会不断增加)中等概率地抽取k个数,做法如下:

(1)先取数据流的前k个数,保存在数组reservoir中。

(2)对于第i个数(k+1 <= i <= n),以k/i的概率选择是否保留第i个数,如果第i个数被选中,则从reservoir中随机选择一个数,用第i个数代替它。

(3)重复迭代第二步,reservoir中的k个数就是我们要的结果。

蓄水池采样的证明

为什么这么做可以保证等概率抽取,这里证明一下。我们现在要做的事是等概率的抽取k个数。

(1)当只有k个数的时, 每个数被抽取的概率是k/k(也就是1啦),k个数都放到蓄水池中。

(2)假设现在增加了一个数,第k+1个数,用k/(k+1)的概率选择是否保留,此时第k+1个数被保留的概率是k/(k+1)。

对于蓄水池中的k个数,它们被留下的概率是多少呢?它们原来的概率都是1,但是现在新来了一个数据,每个数据都面临被淘汰的风险。

淘汰的概率为(第k+1个数被选中的概率)乘以(每个数据被选中去淘汰的概率),即k/(k+1)*(1/k) = 1/(k+1)。

那么被留下的概率就是 1 - (被淘汰的概率) = 1- 1/(k+1) = k/(k+1)。

但是这个概率还要乘上原来被保留的概率k/k,也就是1啦,所以不用乘了,就是k/(k+1)

这样一来,所有的数据被留下的概率都是k/(k+1),满足等概率抽取,得证。

(3)推广到k+2,k+3到n和步骤二中是一样的道理。

假设现在增加了一个数,第m个数,用k/m的概率选择是否保留,此时第m个数被保留的概率是k/m。

对于蓄水池中的k个数,它们原来的被保留概率是k/(m-1),但是现在新来了一个数据,每个数据都面临被淘汰的风险。

淘汰的概率为(第m个数被选中的概率)乘以(每个数据被选中去淘汰的概率),即k/m * (1/k) = 1/m。

那么被留下来的概率就是1 - (被淘汰的概率)= 1 - 1/m = (m-1)/m。

但是这个概率还要乘上原来的被保留概率k/(m-1),即 (m-1)/m * ( k/(m-1)) = k/m。

这样一来,所有的数据被留下的概率都是k/m,满足等概率抽取,得证。

时间复杂度O(n),空间复杂度O(k),k为要取的数的个数,本题中k等于1。

3. 代码

每次random索引,然后遍历链表的做法

# Definition for singly-linked list.
# class ListNode(object):
# def __init__(self, x):
# self.val = x
# self.next = None
class Solution(object):
def __init__(self, head):
self.head = head
p = head
i = 0
while p != None:
i += 1
p = p.next
self.n = i def getRandom(self):
i = random.randint(0,self.n-1)
p = self.head
while i:
p = p.next
i -= 1
return p.val

先用数组存起来,每次random索引后直接取得

class Solution(object):
def __init__(self, head):
self.nums = []
while head != None:
self.nums.append(head.val)
head = head.next def getRandom(self):
i = random.randint(0,len(self.nums)-1)
return self.nums[i]

蓄水池采样

import random
class ListNode(object):
def __init__(self, x):
self.val = x
self.next = None class Solution(object):
def __init__(self, head):
self.head = head def getRandom(self):
p = self.head
num = p.val
count = 2
while p.next:
p = p.next
if(random.random() < 1.0/count):
num = p.val
count += 1
return num

4. 类似题目

398. Random Pick Index

382. Linked List Random Node(蓄水池采样)的更多相关文章

  1. 【LeetCode】382. Linked List Random Node 解题报告(Python & C++)

    作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 数组保存再随机选择 蓄水池抽样 日期 题目地址:ht ...

  2. [LeetCode] 382. Linked List Random Node 链表随机节点

    Given a singly linked list, return a random node's value from the linked list. Each node must have t ...

  3. Leetcode 382. Linked List Random Node

    本题可以用reservoir sampling来解决不明list长度的情况下平均概率选择元素的问题. 假设在[x_1,...,x_n]只选一个元素,要求每个元素被选中的概率都是1/n,但是n未知. 其 ...

  4. 382. Linked List Random Node

    Given a singly linked list, return a random node's value from the linked list. Each node must have t ...

  5. [LeetCode] 382. Linked List Random Node ☆☆☆

    Given a singly linked list, return a random node's value from the linked list. Each node must have t ...

  6. 382 Linked List Random Node 链表随机节点

    给定一个单链表,随机选择链表的一个节点,并返回相应的节点值.保证每个节点被选的概率一样.进阶:如果链表十分大且长度未知,如何解决这个问题?你能否使用常数级空间复杂度实现?示例:// 初始化一个单链表 ...

  7. [LeetCode] Linked List Random Node 链表随机节点

    Given a singly linked list, return a random node's value from the linked list. Each node must have t ...

  8. LeetCode: Linked List Random Node

    这题参照http://blog.jobbole.com/42550/ 用的蓄水池算法,即更改ans的概率为1/(当前length) /** * Definition for singly-linked ...

  9. [Swift]LeetCode382. 链表随机节点 | Linked List Random Node

    Given a singly linked list, return a random node's value from the linked list. Each node must have t ...

随机推荐

  1. linux 安装 nodejs

    原文地址:https://nodejs.org/en/download/package-manager/#enterprise-linux-and-fedora 1)定位到nodejs的官方源(如果直 ...

  2. 【RF库Collections测试】combine lists

    Arguments: [ *lists ]Combines the given `lists` together and returns the result. The given lists are ...

  3. FastCGI中fastcgi_param 详细说明

    fastcgi_param  SCRIPT_FILENAME    $document_root$fastcgi_script_name;#脚本文件请求的路径 fastcgi_param  QUERY ...

  4. php学习九:存取器&魔术方法

    当声明属性的时候用到了private,那么的话只能本类中才能访问此属性,其他地方无法使用,这个时候需要给外界提供一些方法来使外界访问 方法一:存取器: 可以提供一个public的方法来使外界对类里面的 ...

  5. PyQt4预定义对话框

    PyQt4中的对话框 对话窗口和对话框是现代GUI应用程序必不可少的一部分.生活中“对话”被定义为发生在两人或更多人之间的会话.而在计算机世界,“对话”则时人与应用程序之间的“会话”.人及对话的形式有 ...

  6. OpenStack三个节点icehouse

    一.环境准备 1.架构 创建3台虚拟机,分别作为controll节点.network节点和compute1节点. Controller节点:1processor,2G memory,5G storag ...

  7. ThinkPHP的增删改查!

    对表的操作: 增加:M('表名')->add($data);  (可以是数组) 删除:M('表名')->delete($data); (不可以是数组,删除多个有另外的方法) 修改:M('表 ...

  8. Thinkphp自定义工具类的使用!

    在使用Thinkphp做开发的时候,很多时候会用到一些自己写的类,为了方便管理,可以把这些类,单独放到一个文件里. 这就是自定义工具类: 首先在 Application 目录下新建 Component ...

  9. Hibernate--快速上手

    一.初识 Hibernate 经典的软件应用体系结构有三层:表示层(提供了与用户交互的接口,实现用户操作界面,展示用户需要的数据).业务逻辑层(完成业务流程,处理表示层提交的数据请求,并将要保存的数据 ...

  10. 170710、springboot编程之启动器Starter详解

    此文系参考网络大牛的,如有侵权,请见谅! Spring Boot应用启动器基本的一共有N(现知道的是44)种:具体如下: 1)spring-boot-starter 这是Spring Boot的核心启 ...