RTX显卡运行TensorFlow=1.14.0 代码报错 Could not create cudnn handle: CUDNN_STATUS_INTERNAL

硬件环境：

RTX2070super 显卡

软件环境：

Ubuntu18.04.5

Tensorflow = 1.14.0

---------------------------------------------------------------------

运行代码：

import numpy as np

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

def dense(x, size, scope):

    return tf.contrib.layers.fully_connected(x, size,

                        activation_fn=None, scope=scope)

def dense_relu(x, size, scope):

    with tf.variable_scope(scope):

        h1 = dense(x, size, 'dense')

        return tf.nn.relu(h1, 'relu')

tf.reset_default_graph()

x = tf.placeholder('float32', (None, 784), name='x')

y = tf.placeholder('float32', (None, 10), name='y')

phase = tf.placeholder(tf.bool, name='phase')

h1 = dense_relu(x, 100, 'layer1')

h1 = tf.contrib.layers.batch_norm(h1,

                            center=True, scale=True,

                            is_training=phase,

                            scope='bn_1')

h2 = dense_relu(h1, 100, 'layer2')

h2 = tf.contrib.layers.batch_norm(h2,

                            center=True, scale=True,

                            is_training=phase,

                            scope='bn_2')

logits = dense(h2, 10, scope='logits')

with tf.name_scope('accuracy'):

    accuracy = tf.reduce_mean(tf.cast(

            tf.equal(tf.argmax(y, 1), tf.argmax(logits, 1)),

            'float32'))

with tf.name_scope('loss'):

    loss = tf.reduce_mean(

        tf.nn.softmax_cross_entropy_with_logits(logits=logits, labels=y))

def train():

    update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)

    with tf.control_dependencies(update_ops):

        train_step = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

    sess = tf.Session()

    sess.run(tf.global_variables_initializer())

    history = []

    iterep = 500

    for i in range(iterep * 30):

        x_train, y_train = mnist.train.next_batch(100)

        sess.run(train_step,

                 feed_dict={'x:0': x_train,

                            'y:0': y_train,

                            'phase:0': 1})

        if (i + 1) %  iterep == 0:

            epoch = (i + 1)/iterep

            tr = sess.run([loss, accuracy],

                          feed_dict={'x:0': mnist.train.images,

                                     'y:0': mnist.train.labels,

                                     'phase:0': 1})

            t = sess.run([loss, accuracy],

                         feed_dict={'x:0': mnist.test.images,

                                    'y:0': mnist.test.labels,

                                    'phase:0': 0})

            history += [[epoch] + tr + t]

            print( history[-1] )

    return history

train()

报错，具体如下：

2020-08-09 21:03:53.837785: E tensorflow/stream_executor/cuda/cuda_dnn.cc:329] Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR

2020-08-09 21:03:53.837987: W ./tensorflow/stream_executor/stream.h:1995] attempting to perform DNN operation using StreamExecutor without DNN support

Traceback (most recent call last):

  File "/home/devil/anaconda3/lib/python3.7/site-packages/tensorflow/python/client/session.py", line 1356, in _do_call

    return fn(*args)

  File "/home/devil/anaconda3/lib/python3.7/site-packages/tensorflow/python/client/session.py", line 1341, in _run_fn

    options, feed_dict, fetch_list, target_list, run_metadata)

  File "/home/devil/anaconda3/lib/python3.7/site-packages/tensorflow/python/client/session.py", line 1429, in _call_tf_sessionrun

    run_metadata)

tensorflow.python.framework.errors_impl.InternalError: cuDNN launch failure : input shape ([100,100,1,1])

     [[{{node bn_1/cond/FusedBatchNorm}}]]

During handling of the above exception, another exception occurred:

不使用显卡进行计算，正常运行：

或：

主要语句：

CUDA_VISIBLE_DEVICES=-1

正常运行：

如果这种情况要仍然要使用 RTX 显卡, 那么加入下面语句（对会话session 的创建不使用默认设置，而是进行配置）：

使用非交互的session时候，如下：

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.5)

sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

或

gpu_options = tf.GPUOptions( allow_growth = True )

sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

或

gpu_options = tf.GPUOptions( per_process_gpu_memory_fraction=0.5, allow_growth = True )

sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

总之，就是不能使用默认配置的session，需要配置一下。

其中，

per_process_gpu_memory_fraction=0.5

是指为该程序分配使用的显卡其内存不超过总内存的 0.5倍。

--------------------------------------------------------

发生该问题的原因：

Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR 这个问题大部分是因为RTX显卡不兼容它出生前的接口有关。

原因解释出自资料：

https://blog.csdn.net/pkuyjxu/article/details/89402298

-------------

对上面代码中对 tensor 进行运算的代码中 feed_dict 的形式不是很熟悉，即：

因为以前经常使用的形式为：

于是很好奇，将代码改为如下：

发现报错：

从报错中可以知道，原来 feed_dict 中的key 是可以用所构建的图的tensor（用函数tf.placeholder生成的tensor）在图内的名字来表示的，即 "<op_name>:<output_index>" ，也就是这里的 “x:0” 。

而我们以前常用的形式是将构建图中tensor （用tf.placeholder生成的tensor）的那个变量即 x 作为 feed_dict 中的key 的。

比如：

这里，我们相当于构建了一个tensor （用函数tf.placeholder生成的tensor）， tensor的名字为 'xxx:0' ，但是所构建的这个tensor 的变量为 x 。

详细的说就是：

x = tf.placeholder('float32', (None, 784), name='x') 中， name="x" 是说这个tf.placeholer函数在图中所定义的操作（ operation）的名字（name）是 “xxx” , 而图中的这个操作产生的第0个tensor在图中的名字为 “xxx:0” ，而这个名字为 “xxx:0” 的tensor又传递给了python变量x ，因此在 feed_dict 中我们可以使用变量x 来表示这个tensor，也可以使用这个tensor的图内的名字“xxx:0” 来表示。需要注意的是“xxx”是操作（operation）的名字，而不是tensor的名字。

对于 tensor 的这个 "<op_name>:<output_index>" 形式的表示还是很长知识的。

注：

这里传给 feed_dict 的变量都是使用 tf.placeholder生成的 tensor 的变量，这种变量也是整个图所依赖的起始tensor的变量。

-----------------------------------------------------

以下给出 feed_dict 的两个混合写法的代码：

import numpy as np

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

def dense(x, size, scope):

    return tf.contrib.layers.fully_connected(x, size,

                        activation_fn=None, scope=scope)

def dense_relu(x, size, scope):

    with tf.variable_scope(scope):

        h1 = dense(x, size, 'dense')

        return tf.nn.relu(h1, 'relu')

tf.reset_default_graph()

x = tf.placeholder('float32', (None, 784), name='x')

y = tf.placeholder('float32', (None, 10), name='y')

phase = tf.placeholder(tf.bool, name='phase')

h1 = dense_relu(x, 100, 'layer1')

h1 = tf.contrib.layers.batch_norm(h1,

                            center=True, scale=True,

                            is_training=phase,

                            scope='bn_1')

h2 = dense_relu(h1, 100, 'layer2')

h2 = tf.contrib.layers.batch_norm(h2,

                            center=True, scale=True,

                            is_training=phase,

                            scope='bn_2')

logits = dense(h2, 10, scope='logits')

with tf.name_scope('accuracy'):

    accuracy = tf.reduce_mean(tf.cast(

            tf.equal(tf.argmax(y, 1), tf.argmax(logits, 1)),

            'float32'))

with tf.name_scope('loss'):

    loss = tf.reduce_mean(

        tf.nn.softmax_cross_entropy_with_logits(logits=logits, labels=y))

def train():

    update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)

    with tf.control_dependencies(update_ops):

        train_step = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

    gpu_options = tf.GPUOptions( per_process_gpu_memory_fraction=0.5, allow_growth = True )

    sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

    #sess = tf.Session()

    sess.run(tf.global_variables_initializer())

    history = []

    iterep = 500

    for i in range(iterep * 30):

        x_train, y_train = mnist.train.next_batch(100)

        sess.run(train_step,

                 feed_dict={x: x_train,

                            'y:0': y_train,

                            phase: 1})

        if (i + 1) %  iterep == 0:

            epoch = (i + 1)/iterep

            tr = sess.run([loss, accuracy],

                          feed_dict={'x:0': mnist.train.images,

                                     y: mnist.train.labels,

                                     phase: 1})

            t = sess.run([loss, accuracy],

                         feed_dict={x: mnist.test.images,

                                    y: mnist.test.labels,

                                    'phase:0': 0})

            history += [[epoch] + tr + t]

            print( history[-1] )

    return history

train()

RTX显卡运行TensorFlow=1.14.0 代码报错 Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR的更多相关文章

Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR tensorflow-1.13.1和1.14windows版本目前不支持CUDA10.0
报错出现 Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR tensorflow-1.13.1和1.14windows版本目前不支持 ...
CUDA报错： Cannot create Cublas handle. Cublas won't be available. 以及：Check failed: status == CUBLAS_STATUS_SUCCESS (1 vs. 0) CUBLAS_STATUS_NOT_INITIALIZED
Error描述: aita@aita-Alienware-Area-51-R5:~/AITA2/daisida/ssd-github/caffe$ make runtest -j8 .build_re ...
首次运行tensorflow-gpu 1.0 报错 failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED
发现博客: https://blog.csdn.net/u010752600/article/details/79534910 于是找到解决方法. sudo rm -rf ~/.nv/
SQL Developer 4.0 启动报错“unable to create an instance of the java virtual machine located at path”
安装了Oracle之后,第一件事情就是想想怎么去连接,进而操作.SQL Developer是官方提供的强大工具,个人看来也是第一选择. 目前官网提供的最新版是4.0.1.14.48,下载下来之后,就跃 ...
svn 提交代码报错
svn 提交代码报错最近新安装了TortoiseSvn 1.92,在上传代码,其中有新增加的文件,出现如下错误: 解决方法: 1.用vs生成patch文件 2.生成的patch文件中讲nonexis ...
Idea下的springboot mysql8.0等报错解决随笔
cannot load jdbc class path:mysql8.0装载失败,可能原因,驱动名称错误,连接字符串中需要加入时区UTC,否则8.0一定会报错无法连接,关闭SSL 在applicati ...
执行Spark运行在yarn上的命令报错 spark-shell --master yarn-client
1.执行Spark运行在yarn上的命令报错 spark-shell --master yarn-client,错误如下所示: // :: ERROR SparkContext: Error init ...
如何解决spring boot 项目导入依赖后代码报错问题
如何解决spring boot 项目导入依赖后代码报错问题 2020-08-15 14:17:18 代码截图如图所示(由于本人问题已经解决,没来得及截图,所以在网上找了一张图片)
Tomcat7.0启动报错：java.lang.illegalargumentexception:taglib definition not consisten with specification version
Tomcat7.0启动报错:java.lang.illegalargumentexception:taglib definition not consisten with specification ...
wince6.0 编译报错:"error C2220: warning treated as error - no 'object' file generated"的解决办法
内容提要:wince6.0编译报错:"error C2220: warning treated as error - no 'object' file generated" 原因是 ...

随机推荐

10位，13位时间戳转为C#.NET格式时间 DateTime
10位,13位时间戳转为C#.NET格式时间 DateTime - public static DateTime ToDateTime( string timestamp) { var tz = Ti ...
订单号规则，不能重复。redis去重 redis集合set应用
订单号规则,不能重复.redis去重 redis集合set应用 redis锁定商品解决并发售卖问题 RedisUtil工具类https://www.cnblogs.com/oktokeep/p/179 ...
requests的使用
准备工作安装request库 pip install request 实例引入 get方法实现GET请求,返回一个Response对象,存放在变量r中,分别输出响应的类型.状态码.响应体的类型.内容 ...
Jenkins构建项目遇到的问题总结
4.2.1 在Windows下,Jenkins运行python项目 https://www.jianshu.com/p/f6edbaaa8a0d 4.2.2 配置不同类型的项目的操作步骤 http ...
Android自动化无障碍服务开源库-Assists v3.0.0
Assists v3.0.0 Android无障碍服务(AccessibilityService)开发框架,快速开发复杂自动化任务.远程协助.监听等 Android无障碍服务能做什么利用Androi ...
设备树DTS 学习：3-驱动开发中常用的 DTS api
背景本章的内容是为了实现在驱动中的开发,通过调用有关的api来寻找设备树节点熟悉,从而达到使用设备树进行驱动开发的目的. 参考:Linux内核设备树操作常用API Linux设备树语法详解一文中介 ...
攻防世界——CRYPTO新手练习区解题总结<3>(9-12题)
第九题easychallenge: 下载附件,得到一个后缀为pyc的文件,上网百度一下pyc文件,得知 pyc是一种二进制文件,是由py文件经过编译后,生成的文件,是一种byte code,py文件变 ...
GUI自动化测试策略
标签(空格分隔): GUI自动化策略带你看看实际的大型全球化电商网站的 GUI 自动化测试如何开展.这场实战,我将从以下两个方面展开试策略如何设计?这一点,我会根据亲身经历的实际项目,和你探讨 G ...
Webpack5
Webpack是一款模块打包工具,可以把多个文件打包成一个或几个文件,它不仅能打包JS文件, 还能打包css, image等静态资源.当然,在默认情况下,它只打包JS文件和JSON文件,因为它只认识J ...
joig2022_e 题解
设计 $f_i$ 表示以第 $i$ 个数结尾的选择的最大值. 有 $f_i = f_j + a_i$($type_i \not = type_j$). 发现可以选择的种类其实构成两段连 ...

RTX显卡 运行TensorFlow=1.14.0 代码 报错 Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR

RTX显卡 运行TensorFlow=1.14.0 代码 报错 Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR的更多相关文章

随机推荐

热门专题

RTX显卡运行TensorFlow=1.14.0 代码报错 Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR

RTX显卡运行TensorFlow=1.14.0 代码报错 Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR的更多相关文章