tf.image.crop_and_resize(

  image,

  boxes,

  box_ind,

  crop_size,

  method='bilinear',

  extrapolation_value=0,

  name=None

)

从输入图像张量中提取crop(裁剪),并双线调整它们的大小(可能高宽比变化),到由crop_size指定的通用输出大小。这比从输入图像中提取固定大小切片并且不允许调整大小或宽高比变化的crop_to_bounding_box操作更普遍。

从输入image中返回一个crops张量,位于boxes(参数2)的边界框位置出定义的位置。 裁剪后的框都是调整大小为固定size=[crop_height, crop_width]. 结果是一个四维张量[num_boxes, crop_height, crop_width, depth]. 调整大小是角对齐。如果boxex=[[0,0,1,1]], 该方法将为使用tf.image.resize_biliner()与align_corners=True提供相同的结果。

参数:

image: 一个Tensor, 一个形状为[batch, image_height, image_width, depth]的四维张量,image_height和image_width需要为正值。

boxes: 一个类型为float32的Tensor, 形状为[num_boxes,4]的二维张量。 张量的第i行指定box_ind[i]图像中框的位置,并且在标准化坐标中心指定[y1,x1,y2,x2];标准化的坐标值y被映射到图像坐标y* (image_height-1)处,从而标准化图像高度的[0,1]间隔被映射到[0, image_height-1]的图像高度坐标中。我们允许y1>y2,在这种情况下,采样的裁剪是原始图像的上下翻转版本。宽度维度的处理方式类似。[0,1]范围之外的标准化坐标是允许的,在这种情况下,我们使用extrapolation_value外推输入图像值。

box_ind: 一个int32类型的Tensor;形状为[num_box]的一维张量,在[0, batch]中具有int32值。该box_ind[i]值指定第i个方框要引用的图像。

crop_size: 一个int32类型的Tensor; 一个2个元素的一维度张量, size=[crop_height, crop_widht].所有裁剪的图像修补程序都调整为此大小。图像内容的宽高比不被保留; crop_height和crop_width需要为正值。

name: 操作的名称(可选)

返回值:

tf.image.crop_and_resize函数返回一个类型的float32的Tensor.

TensofFlow函数: tf.image.crop_and_resize的更多相关文章

  1. 关于 tf.image.crop_and_resize的使用

    https://blog.csdn.net/m0_38024332/article/details/81779544 关于 tf.image.crop_and_resize 的使用  最近在学习fas ...

  2. 第三节,TensorFlow 使用CNN实现手写数字识别(卷积函数tf.nn.convd介绍)

    上一节,我们已经讲解了使用全连接网络实现手写数字识别,其正确率大概能达到98%,这一节我们使用卷积神经网络来实现手写数字识别, 其准确率可以超过99%,程序主要包括以下几块内容 [1]: 导入数据,即 ...

  3. Tensorflow函数——tf.variable_scope()

    Tensorflow函数——tf.variable_scope()详解 https://blog.csdn.net/yuan0061/article/details/80576703 2018年06月 ...

  4. TF-卷积函数 tf.nn.conv2d 介绍

    转自 http://www.cnblogs.com/welhzh/p/6607581.html 下面是这位博主自己的翻译加上测试心得 tf.nn.conv2d是TensorFlow里面实现卷积的函数, ...

  5. Tensorflow常用的函数:tf.cast

    1.tf.cast(x,dtype,name) 此函数的目的是为了将x数据,准换为dtype所表示的类型,例如tf.float32,tf.bool,tf.uint8等 example:  import ...

  6. tensorflow四维tensor的形状以及函数tf.argmax( )的笔记

    关于tensorflow里多维数组(主要是四维)的组织形式之前一直没弄懂,最近遇到相关问题,算是搞清楚了一些东西,特别记下来,免得自己又遗忘了. 三维形式能很简单的脑补出来三维的形状,不再赘述. 之前 ...

  7. Tensorflow函数——tf.placeholder()函数

    tf.placeholder()函数 Tensorflow中的palceholder,中文翻译为占位符,什么意思呢? 在Tensoflow2.0以前,还是静态图的设计思想,整个设计理念是计算流图,在编 ...

  8. TF-池化函数 tf.nn.max_pool 的介绍

    转载自此大神 http://blog.csdn.net/mao_xiao_feng/article/details/53453926 max pooling是CNN当中的最大值池化操作,其实用法和卷积 ...

  9. tf入门-池化函数 tf.nn.max_pool 的介绍

    转载自此大神 http://blog.csdn.net/mao_xiao_feng/article/details/53453926 max pooling是CNN当中的最大值池化操作,其实用法和卷积 ...

随机推荐

  1. GNSS频率分配表

    说明: 公开资料表示,GPS L3用于核爆炸等高能红外辐射事件的侦查,L4用于电离层研究. GLONASS FDMA信号G1.G2.G3三个频段各自频点见以下附表,摘自ITU的频率协调结果. GLON ...

  2. 图解servlet

    You can see the following illustration to better understand the lifecycle of the Servlet. When the r ...

  3. MySQL(8)---游标

    Mysql(8)-游标 上一遍博客写了有关存储过程的语法知识 Mysql(7)---存储过程 游标或许你在工作中很少用到,但用不到不代表不去了解它,但你真正需要它来解决问题的时候,再花时间去学习很可能 ...

  4. [笔记] .net core WPF 程序,发布独立程序与单一执行程序

    如何发布独立可运行的,和只有一个文件的 .net core WPF 程序. 1 发布并打包 Step 1 在项目上右键,在菜单中选择发布,使用文件发布,选择独立部署模式,其它的条件,依照自己的情况设置 ...

  5. Python中断多重循环的几种思路

    I. 跳出单循环 不管是什么编程语言,都有可能会有跳出循环的需求,比如枚举时,找到一个满足条件的数就终止.跳出单循环是很简单的,比如 for i in range(10): if i > 5: ...

  6. SILK编码语音转WAV格式

    - SILK编码 SILK采样率可为8.12.16或24 kHz,比特率可为6至40 kbit/s.对应到报文层面的直观印象,即SILK编码的语音数据每帧长度是不等的. SILK编码已经开源,目前可下 ...

  7. Android开发:getSupportFragmentManager()不可用

    getSupportFragmentManager()这个函数不可用显然是因为activity继承错误了,因此我们需要将整个类的所继承的类改变即可 public class MainActivity ...

  8. ubuntu下查看(改变)本地端口开放情况,开启和关闭防火墙

    查看开放端口: sudo ufw status 允许80端口开放: sudo ufw allow 允许22端口开放: sudo ufw allow 启动防火墙: sudo ufw enable 重启防 ...

  9. 微信小程序底部导航栏(tabbar)

    在app.json处设置“tabBar”,例子如下: { "pages": [ "pages/index/index", "pages/pages1/ ...

  10. momentjs在vue中的用法

    js代码 import moment from 'moment'; const jsCountDown = document.getElementById('js-countdown'); const ...