tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB

这种问题是，对于每一个变量 variable 由于是基于protobuf存在这大小限制(2G),这个时候，我们需要将embedding拆开，拆分成N等分，来使得每一个

variable都在2G以下;

 # !/usr/bin/env/python

 # coding=utf-8

 import tensorflow as tf

 import numpy as np

 input_ids = tf.placeholder(dtype=tf.int32, shape=[None,None])

 num_shards = 3

 weights = []

 weights_shape = np.arange(27).reshape(9, 3)

 # assert weights_shape[0] % num_shards == 0

 num_shards_len = (weights_shape.shape[0]) / num_shards

 assert  (weights_shape.shape[0]) % num_shards ==0

 begin_ = 0

 ends_ = num_shards_len

 for i in range(0, num_shards):

     if (i + 1) * num_shards_len < weights_shape.shape[0]:

         begin_ = i * num_shards_len

         if i + 1 == num_shards:

             ends_ = weights_shape.shape[0]

         else:

             ends_ = (i + 1) * num_shards_len

     else:

         begin_ = i * num_shards_len

         ends_ = weights_shape.shape[0]

     weights_i = tf.get_variable("words-%02d" % i,

                                 initializer=tf.constant(weights_shape[begin_: ends_, ]))

     weights.append(weights_i)

 input_embedding = tf.nn.embedding_lookup(weights, input_ids,partition_strategy="div")

 sess = tf.InteractiveSession()

 sess.run(tf.global_variables_initializer())

 print(sess.run(weights))

 print(sess.run(input_embedding, feed_dict={input_ids: [[1, 2], [3, 0], [8, 2], [5, 1]]}))

结果为:

[array([[0, 1, 2],

       [3, 4, 5],

       [6, 7, 8]]), array([[ 9, 10, 11],

       [12, 13, 14],

       [15, 16, 17]]), array([[18, 19, 20],

       [21, 22, 23],

       [24, 25, 26]])]

[[[ 3  4  5]

  [ 6  7  8]]

 [[ 9 10 11]

  [ 0  1  2]]

 [[24 25 26]

  [ 6  7  8]]

 [[15 16 17]

  [ 3  4  5]]]

tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB的更多相关文章

Tensorflow同时加载使用多个模型
在Tensorflow中,所有操作对象都包装到相应的Session中的,所以想要使用不同的模型就需要将这些模型加载到不同的Session中并在使用的时候申明是哪个Session,从而避免由于Sessi ...
MFC加载大型osg模型
MFC加载模型,发现打开 Navid 缓冲等选项后,加载大型模型的速度就快了很多. #include "stdafx.h" #include "OSGObject.h&q ...
[CG从零开始] 6. 加载一个柴犬模型学习UV贴图
在第 5 篇文章中,我们成功加载了 fbx 模型,并且做了 MVP 变换,将立方体按照透视投影渲染了出来.但是当时只是随机给顶点颜色,并且默认 fbx 文件里只有一个 mesh,这次我们来加载一个柴犬 ...
"C:\Program Files\Internet Explorer\iexplore.exe" -extoff 无加载项启动IE 浏览器打开时全屏模式
"C:\Program Files\Internet Explorer\iexplore.exe" -extoff 无加载项启动IE浏览器打开时全屏模式
tensorflow数据加载、模型训练及预测
数据集 DNN 依赖于大量的数据.可以收集或生成数据,也可以使用可用的标准数据集.TensorFlow 支持三种主要的读取数据的方法,可以在不同的数据集中使用:本教程中用来训练建立模型的一些数据集介绍 ...
tensorflow学习笔记2：c++程序静态链接tensorflow库加载模型文件
首先需要搞定tensorflow c++库,搜了一遍没有找到现成的包,于是下载tensorflow的源码开始编译: tensorflow的contrib中有一个makefile项目,极大的简化的接下来 ...
用TWaver加载大型游戏场景一例
游戏中经常会出现一些大型的户外场景,例如一个小镇.一座古城等.通常这种场景中包含了较多的建筑.道路.桥梁等等元素,其3D模型比较大且复杂.在使用TWaver加载时,可使用一些技巧,让加载速度更快.显示 ...
tensorflow数据集加载
本篇涉及的内容主要有小型常用的经典数据集的加载步骤,tensorflow提供了如下接口:keras.datasets.tf.data.Dataset.from_tensor_slices(shuffl ...
Windows下pycharm远程连接服务器调试-tensorflow无法加载问题
最近打算在win系统下使用pycharm开发程序,并远程连接服务器调试程序,其中在import tensorflow时报错如图所示(在远程服务器中执行程序正常): 直观错误为: ImportError ...

随机推荐

JAVA项目中常用的异常处理情况
1.数学运算异常( java.lang.arithmeticexception) 程序中出现了除以零这样的运算就会出这样的异常,对这种异常,大家就要好好检查一下自己程序中涉及到数学运算的地方,公式是不 ...
POJ 3020 Antenna Placement (二分图最小路径覆盖)
<题目链接> 题目大意:一个矩形中,有N个城市’*’,现在这n个城市都要覆盖无线,每放置一个基站,至多可以覆盖相邻的两个城市.问至少放置多少个基站才能使得所有的城市都覆盖无线? 解题分析: ...
GYM 101755 K.Video Reviews 【贪心】+【二分】
<题目链接> 题目大意: 一家公司想让n个人给他们的产品评论,所以依次去找这n个人,第i个人会评论当且仅当已经有ai个人评论或他确实对这个产品感兴趣,但是这n个人都不对这个产品感兴趣,问这 ...
Git rebase命令实战
一.前言一句话,git rebase 可以帮助项目中的提交历史干净整洁!!! 二.避免合并出现分叉现象 git merge操作 1.新建一个 develop 分支 2.在develop分支上新建 ...
Java -- 内部类（一）
什么是内部类将一个类的定义放在另一个类的定义内部,这就是内部类.在Java中内部类主要分为成员内部类.局部内部类.匿名内部类.静态内部类.举个栗子: public class A { public ...
3466 ACM Proud Merchants 变形的01背包
题目:http://acm.hdu.edu.cn/showproblem.php?pid=3466 题意:假设你有M元,已经Pi,Qi,Vi(i为角标,1<i<N),当M>Qi,时才 ...
理解Hadoop脚本hadoop-2.5.0/bin/hadoop
1 #!/usr/bin/env bash 此处为什么不是 #!/bin/bash ? 考虑到程序的可移植性,env的作用就是为了找到正确的脚本解释器(这里就是bash),在不同的Linux ...
什么是OKR？
什么是OKR OKR全称是Objectives and Key Results,即目标与关键成果法.OKR是一套定义和跟踪目标及其完成情况的管理工具和方法.1999年 Intel公司发明了这种方法,后 ...
常用的sort打乱数组方法真的有用？
JavaScript 开发中有时会遇到要将一个数组随机排序(shuffle)的需求,一个常见的写法是这样: function shuffle(arr) { arr.sort(function () { ...
关于UITableView的一些老是忘记的小杂碎
1:如何取消单元格的选中状态简简单单的一句 [TableView deselectRowAtIndexPath:[TableView indexPathForSelectedRow] animate ...

tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB

tensorflow 在加载大型的embedding模型参数时，会遇到cannot be larger than 2GB的更多相关文章

随机推荐

热门专题