文章思路

大神的github和个人网站已经对此进行了说明，这里不再赘述。。。

源码理解

一. 标签点形式

给四个点排列顺序制定规则

'''

按顺序排列四个点，逆时针旋转，且第一个点为左上角点（刚开始选择最左边的点，

如果最后计算的第二个点的Y比第一个点大，那就让最后一个点做为第一个点，其他点依次右移）

1.以最小的X坐标为起点（起名为A）
2.其他三个点和第一个点（A）连线形成夹角，取中间的点为第三个点（起名C）
3.以AC为连线，在AC上方为D，下方为B
4.最后比较AC和BD的斜率，AC>BD ===> 顺序调整为DABC AC<BD ===> 维持ABCD
5.感觉第四步没啥意义，只要是顺序就好了，没必要那么苛刻。。。。

'''

下面给出一些例子

注意长边的位置

针对上面两幅图，第一张的long_edge=0,2，第二张的long_edge=1,3

二. 标签切边

以最短边的0.3进行缩放当做内部点

以最短边的0.6作为头尾点

注意：这里头尾都是针对最长边上的操作

注意：头和尾是按照标签点的顺序进行的，排在前面为头，排在后面为尾

三. loss计算

这部分比较简单，建议由需要的读者直接读取一个data进行debug即可：

#input : 1*w*h*3

#label : 1*160*160*7(batch,w,h,type)

def quad_loss(y_true, y_pred):

    # loss for inside_score

    logits = y_pred[:, :, :, :1]

    labels = y_true[:, :, :, :1]

    # balance positive and negative samples in an image

    beta = 1 - tf.reduce_mean(labels)

    # first apply sigmoid activation

    predicts = tf.nn.sigmoid(logits)

    # log +epsilon for stable cal

    inside_score_loss = tf.reduce_mean(

        -1 * (beta * labels * tf.log(predicts + cfg.epsilon) +

              (1 - beta) * (1 - labels) * tf.log(1 - predicts + cfg.epsilon)))

    inside_score_loss *= cfg.lambda_inside_score_loss

    # loss for side_vertex_code

    vertex_logits = y_pred[:, :, :, 1:3]

    vertex_labels = y_true[:, :, :, 1:3]

    vertex_beta = 1 - (tf.reduce_mean(y_true[:, :, :, 1:2])

                       / (tf.reduce_mean(labels) + cfg.epsilon))

    vertex_predicts = tf.nn.sigmoid(vertex_logits)

    pos = -1 * vertex_beta * vertex_labels * tf.log(vertex_predicts +

                                                    cfg.epsilon)

    neg = -1 * (1 - vertex_beta) * (1 - vertex_labels) * tf.log(

        1 - vertex_predicts + cfg.epsilon)

    positive_weights = tf.cast(tf.equal(y_true[:, :, :, 0], 1), tf.float32)

    side_vertex_code_loss = \

        tf.reduce_sum(tf.reduce_sum(pos + neg, axis=-1) * positive_weights) / (

                tf.reduce_sum(positive_weights) + cfg.epsilon)

    side_vertex_code_loss *= cfg.lambda_side_vertex_code_loss

    # loss for side_vertex_coord delta

    g_hat = y_pred[:, :, :, 3:]

    g_true = y_true[:, :, :, 3:]

    vertex_weights = tf.cast(tf.equal(y_true[:, :, :, 1], 1), tf.float32)

    pixel_wise_smooth_l1norm = smooth_l1_loss(g_hat, g_true, vertex_weights)

    side_vertex_coord_loss = tf.reduce_sum(pixel_wise_smooth_l1norm) / (

            tf.reduce_sum(vertex_weights) + cfg.epsilon)

    side_vertex_coord_loss *= cfg.lambda_side_vertex_coord_loss

    return inside_score_loss + side_vertex_code_loss + side_vertex_coord_loss

def smooth_l1_loss(prediction_tensor, target_tensor, weights):

    n_q = tf.reshape(quad_norm(target_tensor), tf.shape(weights))

    diff = prediction_tensor - target_tensor

    abs_diff = tf.abs(diff)

    abs_diff_lt_1 = tf.less(abs_diff, 1)

    pixel_wise_smooth_l1norm = (tf.reduce_sum(

        tf.where(abs_diff_lt_1, 0.5 * tf.square(abs_diff), abs_diff - 0.5),

        axis=-1) / n_q) * weights

    return pixel_wise_smooth_l1norm

def quad_norm(g_true):

    shape = tf.shape(g_true)

    delta_xy_matrix = tf.reshape(g_true, [-1, 2, 2])

    diff = delta_xy_matrix[:, 0:1, :] - delta_xy_matrix[:, 1:2, :]

    square = tf.square(diff)

    distance = tf.sqrt(tf.reduce_sum(square, axis=-1))

    distance *= 4.0

    distance += cfg.epsilon

    return tf.reshape(distance, shape[:-1])

if __name__ == '__main__':

    x, y = data_generator.gen(1)

    loss_t = quad_loss(y,y)

四. NMS

这部分没仔细看，传统的NMS和LNMS都比较简单，大概看一下就好了

这里主要是说明一下几个参数：

pixel_threshold = 0.9 #内部点阈值(目标点概率)

side_vertex_pixel_threshold = 0.9 #内部头尾点的阈值

##头尾点取值范围，head->[0,trunc_threshold] tail->[1-trunc_threshold,1],变大之后检测能力变强

trunc_threshold = 0.1

最后说明

其实这个项目的思路很简单，看一下就明白，但是具体实现还是有点棘手，难点在于标签的制作

边界点负责回归边界，这个边界如何确定？如何确定头和尾？

具体代码的注释写在里面了，还有很多小细节看笔者注释即可

下载地址

AdvanceEast源码理解的更多相关文章

Caffe源码理解2：SyncedMemory CPU和GPU间的数据同步
目录写在前面成员变量的含义及作用构造与析构内存同步管理参考博客:blog.shinelee.me | 博客园 | CSDN 写在前面在Caffe源码理解1中介绍了Blob类,其中的数据成 ...
基于SpringBoot的Environment源码理解实现分散配置
前提 org.springframework.core.env.Environment是当前应用运行环境的公开接口,主要包括应用程序运行环境的两个关键方面:配置文件(profiles)和属性.Envi ...
jedis的源码理解-基础篇
[jedis的源码理解-基础篇][http://my.oschina.net/u/944165/blog/127998] (关注实现关键功能的类) 基于jedis 2.2.0-SNAPSHOT ...
VUEJS2.0源码理解--优
VUEJS2.0源码理解 http://jiongks.name/blog/vue-code-review/#pingback-112428
Pytorch学习之源码理解：pytorch/examples/mnists
Pytorch学习之源码理解:pytorch/examples/mnists from __future__ import print_function import argparse import ...
.NET Core 3.0之深入源码理解Startup的注册及运行
原文:.NET Core 3.0之深入源码理解Startup的注册及运行写在前面开发.NET Core应用,直接映入眼帘的就是Startup类和Program类,它们是.NET Core应用程 ...
深入源码理解Spring整合MyBatis原理
写在前面聊一聊MyBatis的核心概念.Spring相关的核心内容,主要结合源码理解Spring是如何整合MyBatis的.(结合右侧目录了解吧) MyBatis相关核心概念粗略回顾 SqlSess ...
HashMap源码理解一下？
HashMap 是一个散列桶(本质是数组+链表),散列桶就是数据结构里面的散列表,每个数组元素是一个Node节点,该节点又链接着多个节点形成一个链表,故一个数组元素 = 一个链表,利用了数组线性查找和 ...
JS魔法堂：剖析源码理解Promises/A规范
一.前言 Promises/A是由CommonJS组织制定的异步模式编程规范,有不少库已根据该规范及后来经改进的Promises/A+规范提供了实现如Q, Bluebird, when, rsvp. ...

随机推荐

A Story of One Country (Hard) CodeForces - 1181E2 (分治)
大意: 给定$n$个平面上互不相交的矩形. 若一个矩形区域只包含一个矩形或者它可以水平或垂直切成两块好的区域, 那么这个矩形区域是好的. 求判断整个平面区域是否是好的. 分治判断, 可以用链表实现删除 ...
vmware vcsa-故障1
1.重启vcsa后不能登陆webclient 做实验得时候重启vcsa后不能登陆 web client 开启vcsa直接进入命令模式,命令行登陆后提示:failed to connect to se ...
VS.NET(C#)--1.3_VS2005开始
VS2005开始开始页 1.文件系统:这是默认,把网站创建到当前物理文件系统上(可以本地或网络).此时VS2005将使用内置的Web服务器,不使用IIS运行Web应用程序.2.HTTP使用IIS处理 ...
nodejs中使用mongodb
/** * 使用mongodb存储数据 * 1 首先安装mongodb nodejs插件 npm install mongodb --save-dev * 2 安装express (非必须) * * ...
Asp.net Report动态生成
rdlc报表实质上是一个xml文件,如果要实现动态报表,就需要动态生成rdlc文件,实质上就是读写xml文件: protected XmlDocument GenerationAddReportCol ...
werkzeug/routing.py-Rule源码分析
Rule类主要用来定义和表示一个URL的模式.主要定义了一些关键字参数,用来改变url的行为.例如:这个url可以接收的请求方法,url的子域名,默认路径,端点名称,是否强制有斜杠在末尾等等在最开始 ...
HTML5页面介绍
1.<!DOCTYPE html> 文档声明:用于告诉浏览器使用html哪个版本的标准解析页面,此写法代表使用html5的标准去解析 2.<html> 根标签, ...
【日语】日语N5学习
副词与连接词 ~から: 从-(表示时间.场所起点) ~まで: 到-(表示时间.场所终点) と: 和(并列时用) えーと: 嗯いっしょに: 一起ちょっと: 一点儿いつも: 经常.总是ときどき: ...
java基础点
1.eclipse什么时候编译java类文件 2.在同一包中的类可以相互引用,无需用import语句 3.在Java eclipse用ALT输入特殊符号 4.if else等语句,什么时候可以不加括号 ...
Vue指令之事件修饰符
事件修饰符: + .stop 阻止冒泡 + .prevent 阻止默认事件 + .capture 添加事件侦听器时使用事件捕获模式 + .self 只当事件在该元素本身(比如不是子元素)触发时触发回调 ...

AdvanceEast源码理解