Deepctr框架代码阅读

DeepCtr是一个简易的CTR模型框架，集成了深度学习流行的所有模型，适合学推荐系统模型的人参考。
我在参加比赛中用到了这个框架，但是效果一般，为了搞清楚原因从算法和框架两方面入手。在读代码的过程中遇到一些不理解的问题，所以记录在这里。

dense_embedding和sparse_embedding的区别？
处理dense，是将dense接全连接层变成embedding size的一个list，然后和sparse一样的操作
concat_fun 这里是concat什么？fm的输入为什么需要concat？
原来是list,每一行是一个tensor，concat之后是tensor，每一行是tensor
tf.keras.layers.Flatten()(fm_input)
原先的embedding输入是[d,f,k],deep embedding是[d,f*k]
这里的实现和我的实现不一样：
我的linear+interact+deep接入全连接层，将所有的特征接入全连接层, 但是根据根据论文和多家的博客来看，我之前理解的是错误的，正确的应该是 fm logit+deep logit，最后接全连接层。同时AFM等多个模型都是这么处理的。

运行模型，每次结果不一样：
这个属于正常现象，尤其是数据不够充分的情况下，
主要原因是由于Tensorflow底层的多线程运行机制以及一些具有随机性的op和random seed导致的。
如果想让每次运行的结果尽量一致，可以考虑使用CPU运行程序，并且指定单线程运行，同时固定random seed，包括python自身的，Numpy的还有tensorflow的

总结这个框架：

整体结构清晰灵活，linear返回logit，FM层返回logit，deep包含中间层结果，在每一种模型中打包deep的最后一层，判断linear，fm和deep是否需要，最后接入全连接层。
主要用到的模块和架构： keras的Concatenate（list转tensor），Dense（最后的全连接层和dense），Embedding（sparse，dense，sequence），Input（sparse，dense，sequce）还有常规操作：优化器，正则化项
复用了重载了Layer层，重写了build，call，compute_output_shape，compute_mask，get_config

缺点：

给定的参数都是论文提供的参数，实际使用存在问题，都需要自己修改！
好多参数没有留接口，比如回归问题的loss 是mean_squared_error，只能通过硬写来修改参数
如果想实现自己的模型，复用这个框架，需要了解keras，同时改很多接口，时间代价较大。

Deepctr框架代码阅读的更多相关文章

第07节-开源蓝牙协议BTStack框架代码阅读（下）
上篇博客中已经对BTStack框架进行了较为详细的说明,本篇博客将进一步总结一下(由韦大仙笔记所得). 可以从5个方面来理解BTStack的框架: 1.硬件操作:hci_transport_t BTS ...
第07节-开源蓝牙协议BTStack框架代码阅读（上）
首先来看一下,对于硬件操作,它是如何来进行处理的.在上篇文章中曾说过,在main函数里面它会调用硬件相关的代码,调用操作系统相关的代码.在BTStack中,可以搜索一下main.c,将会发现有很多ma ...
[转]FFMpeg框架代码阅读
简介 FFmpeg是一个集录制.转换.音/视频编码解码功能为一体的完整的开源解决方案. FFmpeg的开发是基于Linux操作系统,但是可以在大多数操作系统中编译和使用.FFmpeg支持MPEG.Di ...
FFMpeg框架代码阅读
http://blog.csdn.net/wstarx/article/details/1572393 FFMPEG源码分析(二) http://www.cnblogs.com/qingquan/ar ...
CI框架源代码阅读笔记3 全局函数Common.php
从本篇開始.将深入CI框架的内部.一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说.全局函数具有最高的载入优先权.因此大多数的框架中BootStrap ...
MediaInfo代码阅读
MediaInfo是一个用来分析媒体文件的开源工具. 支持的文件非常全面,基本上支持所有的媒体文件. 最近是在做HEVC开发,所以比较关注MediaInfo中关于HEVC的分析与处理. 从Meid ...
脚本病毒分析扫描专题2-Powershell代码阅读扫盲
4.2.PowerShell 为了保障木马样本的体积很小利于传播.攻击者会借助宏->WMI->Powershell的方式下载可执行文件恶意代码.最近也经常会遇见利用Powershell通过 ...
CI框架源代码阅读笔记2 一切的入口 index.php
上一节(CI框架源代码阅读笔记1 - 环境准备.基本术语和框架流程)中,我们提到了CI框架的基本流程.这里再次贴出流程图.以备參考: 作为CI框架的入口文件.源代码阅读,自然由此開始. 在源代码阅读的 ...
CGAL代码阅读跳坑指南
CGAL代码阅读跳坑指南整体框架介绍 CGAL中的算法和数据结构由它们使用的对象类型和操作参数化.它们可以处理满足特定语法和语义需求的任何具体模板参数.为了避免长参数列表,参数类型被收集到一个单独的 ...

随机推荐

解决maven 在intellij IDEA 下载依赖包速度慢的问题
解决maven 在intellij IDEA 下载依赖包速度慢的问题参考:https://www.jianshu.com/p/63a593700ebc
Fiddler过滤VsHub请求
Fiddler过滤掉VS2015 VsHub请求打开VS2015, Tools --> Options --> Debugging --> General --> unche ...
19年读100本书之第二本--《OKR工作法》-克里斯蒂娜沃特克
0,一句话概括书的内容? OKR(objective key result),即目标与关键结果. 1,我从这本书能得到什么? 2,核心内容是什么? 3,我要怎么做?
入门项目数字手写体识别：使用Keras完成CNN模型搭建（重要）
摘要: 本文是通过Keras实现深度学习入门项目——数字手写体识别,整个流程介绍比较详细,适合初学者上手实践. 对于图像分类任务而言,卷积神经网络(CNN)是目前最优的网络结构,没有之一.在面部识别. ...
孤荷凌寒自学python第103天认识区块链017
[主要内容] 今天继续分析从github上获取的开源代码怎么实现简单区块链的入门知识,共用时间25分钟. (此外整理作笔记花费了约34分钟) 详细学习过程见文末学习过程屏幕录像. 今天所作的工作是进一 ...
python字典中值为列表或字典的构造方式
1.值为列表的构造方法 dic = {} dic.setdefault(key,[]).append(value) >>dic.setdefault('a',[]).append(1) & ...
【PAT甲级】1020 Tree Traversals (25 分)（树知二求一）
题意: 输入一个正整数N(N<=30),给出一棵二叉树的后序遍历和中序遍历,输出它的层次遍历. trick: 当30个点构成一条单链时,如代码开头处的数据,大约1e9左右的结点编号大小,故采用结 ...
C#的 IComparable 和 IComparer接口及ComparableTo方法的区别（非常重要）
(1)https://blog.csdn.net/ios99999/article/details/77800819 C# IComparable 和 IComparer 区别 (2)https:// ...
深浅copy浅析
Python代码在开始执行的时候,代码会被系统从硬盘调入内存,等候CPU执行,至于怎么个调入逻辑,还不清楚. 在高级语言中,变量是对内存及其地址的抽象.也就是说变量就是内存地址. 那么我们先来介绍两种 ...
Java生鲜电商平台-小程序或者APP拼团功能设计与架构实战
Java生鲜电商平台-小程序或者APP拼团功能设计与架构实战说明:Java生鲜电商平台拼团是拉新引流的利器,将拼团运用到极致的就是拼多多,前期通过选取性价比高.实用性强的商品进行拼团,在社交圈(主要 ...

Deepctr框架代码阅读

Deepctr框架代码阅读的更多相关文章

随机推荐

热门专题