tensorflow,model,object_detection,训练loss先下降后递增，到几百万，解决tensorflow,model,object,detection,loss,incease

现象：训练loss一开始下降一部分，跌代到若干次（具体多少和你的learning rate大小有关，大就迭代小就发生，小就需要多几次迭代）

日志如下（下面的日志来源于网络，我自己的日志已经clear掉了，不过不影响）：

INFO:tensorflow:global step 272: loss = 0.2479 (0.158 sec/step)

INFO:tensorflow:global step 273: loss = 0.3874 (0.159 sec/step)

INFO:tensorflow:global step 274: loss = 0.2599 (0.158 sec/step)

INFO:tensorflow:global step 275: loss = 27207767073038008320.0000 (0.155 sec/step)

INFO:tensorflow:global step 276: loss = 363770730445224804352.0000 (0.154 sec/step)

INFO:tensorflow:global step 277: loss = 2319587573063963639808.0000 (0.157 sec/step)

INFO:tensorflow:global step 278: loss = 9538479895582634672128.0000 (0.155 sec/step)

INFO:tensorflow:global step 279: loss = 35610680577759077466112.0000 (0.153 sec/step)

网上说是可能数据增强的原因，但是根据现象，为什么一开始是正常的呢。知道我我看一个网上的同学说，他发现是他的
label_map.pbtxt中是有5个类别，但是在pipline.config中number_class:4,导致出现不一致，后面该同学修改过来就可以了。

我的解决是，我在label_map.pbtxt中的id是1，name：cat，但是在生成tfrecord的时候是cats，这导致了不一致，使得训练中获取lable1出错。

为什么现象是loss先降低后崩掉（梯度爆炸中比较特殊的一种吧，个人认为）这样呢？
   因为，一开始模型还处于非工作状态，在first stage的时候，模型通过识别到目标使得loss下降，当模型训练到一定程度，对目标识别越来越好，second
loss开始占主导或者second-stage输入变得有规律，不再随机，这时候，需要识别具体是什么目标的时候，tfrecord里面的label是cats，在label_map.pbtxt需要找到
对应的id时，这时候因为“label_map.pbtxt中的id是1，name：cat，但是在生成tfrecord的时候是cats”不一致，导致没取到id，这时就开始乱套了。

所以，做数据要仔细呀

tensorflow,model,object_detection,训练loss先下降后递增，到几百万，解决tensorflow,model,object,detection,loss,incease的更多相关文章

使用TensorFlow Object Detection API+Google ML Engine训练自己的手掌识别器
上次使用Google ML Engine跑了一下TensorFlow Object Detection API中的Quick Start(http://www.cnblogs.com/take-fet ...
第三十二节，使用谷歌Object Detection API进行目标检测、训练新的模型(使用VOC 2012数据集)
前面已经介绍了几种经典的目标检测算法,光学习理论不实践的效果并不大,这里我们使用谷歌的开源框架来实现目标检测.至于为什么不去自己实现呢?主要是因为自己实现比较麻烦,而且调参比较麻烦,我们直接利用别人的 ...
【实践】如何利用tensorflow的object_detection api开源框架训练基于自己数据集的模型（Windows10系统）
如何利用tensorflow的object_detection api开源框架训练基于自己数据集的模型(Windows10系统) 一.环境配置 1. Python3.7.x(注:我用的是3.7.3.安 ...
tflearn 中文汉字识别，训练后模型存为pb给TensorFlow使用——模型层次太深，或者太复杂训练时候都不会收敛
tflearn 中文汉字识别,训练后模型存为pb给TensorFlow使用. 数据目录在data,data下放了汉字识别图片: data$ ls0 1 10 11 12 13 14 15 ...
自己搞了20万张图片100个分类，tensorflow训练23万次后。。。。。。
自己搞了20万张图片100个分类,tensorflow训练23万次后...... 我自己把训练用的一张图片,弄乱之后做了一个预测 100个汉字,20多万张图片,tensorflow CNN训练23万次 ...
[Tensorflow] Object Detection API - predict through your exclusive model
开始预测一.训练结果 From: Testing Custom Object Detector - TensorFlow Object Detection API Tutorial p.6 训练结果 ...
使用Tensorflow Object Detection进行训练和推理
整体流程(以PASCAL VOC为例) 1.下载PASCAL VOC2012数据集,并将数据集转为tfrecord格式 2.选择并下载预训练模型 3.配置训练文件configuration(所有的训练 ...
【Tensorflow】 Object_detection之配置Training Pipeline
参考:Configuring an object detection pipeline 1.config文件配置好的config文件存放路径:object_detection/samples/con ...
Python之TensorFlow的模型训练保存与加载-3
一.TensorFlow的模型保存和加载,使我们在训练和使用时的一种常用方式.我们把训练好的模型通过二次加载训练,或者独立加载模型训练.这基本上都是比较常用的方式. 二.模型的保存与加载类型有2种 1 ...

随机推荐

华为4K机顶盒EC6108V9U从原联通更换为电信的IPTV账号成功经验
4K设备直接在淘宝上买30块钱升级4K机顶盒,i视视手机app控制电视和手机投屏硬件设备:EC6108V9U由X省联通更换为四川电信采坑经验: 1.要从现有的机顶盒获取mac地址.stbid.ip ...
时钟信号的占空比调整——Verilog
时钟信号的占空比调整——Verilog `timescale 1ns / 1ps /////////////////////////////////////////////////////////// ...
PHP swoole实现redis订阅和发布
前戏:实现用户下单,服务器通知后台接收订单...类似美团外卖 1.首先要实现一个订阅程序 $result = $client->connect('127.0.0.1', 6379, functi ...
EntityFramework Inner Exception Catch
在保存时加入这一段,就可以查看error具体是哪里出错了.正式发布需要删除这段,try catch毕竟会影响性能 try { entity.SaveChanges(); } catch (DbEnti ...
python爬虫学习笔记（二）——基础篇之爬虫基本原理
1.什么是爬虫? 请求网站并提取数据的自动化程序 2.爬虫基本流程 2.1发起请求通过HTTP库向目标站点发起请求,即发起一个Request,请求可以包含额外的headers等信息,等待服务器响应: ...
CBSN NEWS
https://www.cbsnews.com/video/fatal-crossing/
ionic2 vscode运行调试
一.环境搭建 1,安装ripple模拟器如果已经注册了淘宝国内镜像使用下面命令 cnpm install -g ripple-emulator 显示结果如下: 2,安装vs code 下载地址htt ...
01_新建WebApi后端服务项目
1.打开微软官网: https://www.asp.net/learn 2.查看文章: https://docs.microsoft.com/en-us/aspnet/web-api/overview ...
Nginx+Memcache+一致性hash算法实现页面分布式缓存（转）
网站响应速度优化包括集群架构中很多方面的瓶颈因素,这里所说的将页面静态化.实现分布式高速缓存就是其中的一个很好的解决方案... 1)先来看看Nginx负载均衡 Nginx负载均衡依赖自带的 ngx_h ...
Access Token 与 Refresh Token【转载哒科普啊】
Access Token 与 Refresh Token access token 是客户端访问资源服务器的令牌.拥有这个令牌代表着得到用户的授权.然而,这个授权应该是临时的,有一定有效期.这是因 ...

tensorflow,model,object_detection,训练loss先下降后递增，到几百万，解决tensorflow,model,object,detection,loss,incease

tensorflow,model,object_detection,训练loss先下降后递增，到几百万，解决tensorflow,model,object,detection,loss,incease的更多相关文章

随机推荐

热门专题