[源码解析] NVIDIA HugeCTR,GPU版本参数服务器 --(1) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器 --(1) 0x00 摘要 0x01 背景 1.1 推荐系统中的点击率估计 1.2 点击率估算训练的挑战 0x02 HugeCtr 0x03 架构 3.1 CTR DL 模型 3.2 HugeCTR 架构 3.3 基于GPU的参数服务器 0x04 核心功能 4.1 模型并行训练 4.1.1 in-memory GPU hash table 4.1.…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (2) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (2) 0x00 摘要 0x01 总体流程 1.1 概述 1.2 如何调用 0x02 Session 2.1 Session 定义 2.2 构造函数 2.2.1 ResourceManager 2.2.1.1 接口 2.2.1.2 Core 2.2.1.3 拓展 0x03 Parser 3.1 定义 3.2 如何组织网络 3.2.1 输入…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器---(3) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器---(3) 0x00 摘要 0x01 回顾 0x02 数据集 2.1 Norm 2.1.1 数据文件 2.1.2 文件列表 2.2 Raw 2.3 Parquet 0x03 CSR 格式 3.1 什么是CSR 3.2 HugeCTR 之中的CSR 3.3 操作类 3.3.1 定义 3.3.2 构造函数 3.3.3 生成新行 3.3.4 插入数据 0…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (4) 0x00 摘要 0x01 总体流程 0x02 DataReader 2.1 定义 2.2 构建 2.3 DataReaderSparseParam 2.3.1 定义 2.3.2 使用 0x03 DataReader Buffer 机制 3.1 比对 3.2 Buffer 相关类 3.3 DataReader构造 3.3.1 辅助 G…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (5) 嵌入式hash表 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (5) 嵌入式hash表 0x00 摘要 0x01 前文回顾 0x02 Embedding 2.1 概念 2.1.1 One-hot 编码 2.1.2 分布式表示 2.1.3 推荐领域 2.2 Lookup 2.3 嵌入层 2.3.1 点积 2.3.2 全连接层 2.3.3 元数据信息 2.3.4 经典架构 2.3.4.1…
[源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (6) --- Distributed hash表 目录 [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (6) --- Distributed hash表 0x00 摘要 0x01 简述 1.1 基类 1.2 功能 0x02 定义 2.1 思路 2.2 代码 0x03 HashTable 3.1 定义 3.2 HashTableContainer 3.3 调用 3.4 concurrent_unor…
[源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(7) ---Distributed Hash之前向传播 目录 [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(7) ---Distributed Hash之前向传播 0x00 摘要 0x01 前文回顾 0x02 总体逻辑 2.1 注释&思路 2.2 总体代码 0x03 配置数据 3.1 CUB函数 3.1.1 cub::DeviceScan::InclusiveSum 3.1.2 cub::Dev…
[源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(8) ---Distributed Hash之后向传播 目录 [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器---(8) ---Distributed Hash之后向传播 0x00 摘要 0x01 回顾 0x02 总述 2.1 注释 2.2 代码 0x03 输入 3.1 定义 3.2 切换 0x04 backward 4.1 总体代码 4.2 AllGather 4.2.1 原理 4.2.2 代码 4.…
[源码解析] NVIDIA HugeCTR,GPU 版本参数服务器 --(9)--- Local hash表 目录 [源码解析] NVIDIA HugeCTR,GPU 版本参数服务器 --(9)--- Local hash表 0x00 摘要 0x01 前文回顾 0x02 定义 0x03 构建 3.1 调用 3.2 构造函数 3.3 如何确定slot 0x04 前向传播 4.1 总述 4.2 alltoall 4.3 Reorder 4.3.1 思路 4.3.2 图示 4.4 slot id 4.…
title: 源码解析之 Mybatis 对 Integer 参数做了什么手脚? date: 2021-03-11 updated: 2021-03-11 categories: Mybatis 源码解析 tags: Mybatis 源码解析 解决方案放在第二节,急需解决问题,可直接查看解决方案. 本文为深度长文,请耐心阅读! 问题描述 在 Mybatis 中,Integer 的入参为 0 时,发现判断条件的非空判断没有生效,原本应该存在的判断条件丢失了. 那么,Mybatis 到底对 Inte…
版本 url中通过GET传参自定义的版本 12345678910111213141516171819202122 from django.http import HttpResponsefrom django.shortcuts import render # Create your views here.from rest_framework.views import APIViewfrom rest_framework.request import Request class ParamVe…
1.TreeMap介绍 TreeMap是一个通过红黑树实现有序的key-value集合. TreeMap继承AbstractMap,也即实现了Map,它是一个Map集合 TreeMap实现了NavigableMap接口,它支持一系列的导航方法, TreeMap实现了Cloneable接口,它可以被克隆 TreeMap introduction:A Red-Black tree based NavigableMap implementation. The map is sorted accordi…
.AsyncTask使用介绍  转载请标明出处:http://blog.csdn.net/seu_calvin/article/details/52172248 AsyncTask封装了Thread和Handler,通过AsyncTask可以很方便地在执行完后台任务后更新UI.如果不太清楚Android的Handler机制,可以查看此篇Android消息机制详解. 1.1  AsyncTask实例使用 下面是一个使用AsyncTask的实例,通过指定URL利用网络下载资源(此例模拟资源为字符串)…
[源码解析] 机器学习参数服务器Paracel (3)------数据处理 目录 [源码解析] 机器学习参数服务器Paracel (3)------数据处理 0x00 摘要 0x01 切分需要 1.1 切分的好处 1.2 数据并行 1.3 模型并行 1.3.1 线性模型 1.3.2 非线性模型(神经网络) 1.4 混合使用 0x02 切分机制与数据格式 2.1 切分原则 2.2 模型和数据格式 2.3 Paracel 数据机制 2.3.1 数据表示 2.3.2 数据加载 0x03 数据加载 3.…
[源码解析] PyTorch 如何使用GPU 目录 [源码解析] PyTorch 如何使用GPU 0x00 摘要 0x01 问题 0x02 移动模型到GPU 2.1 cuda 操作 2.2 Module 2.3 移动 2.3.1 示例 2.3.2 操作 2.3.3 _apply 方法 2.4 小结 0x03 在GPU之上调用函数 3.1 CUDA编程模型基础 3.1.1 异构模型 3.1.2 并行思想 3.1.3 处理流程 3.2 函数 3.2.1 核函数 3.2.2 PyTorch 样例 3.…
[源码解析] 机器学习参数服务器ps-lite 之(3) ----- 代理人Customer 目录 [源码解析] 机器学习参数服务器ps-lite 之(3) ----- 代理人Customer 0x00 摘要 0x01 来源 1.1 目前总体 1.2 Postoffice 1.3 Van 1.4 Customer 1.5 目前逻辑 0x02 基础类 2.1 SArray 2.2 KVPairs 2.3 Node 2.4 Control 2.5 Meta 2.6 Message 2.6.1 结构…
[源码解析] PyTorch 分布式(15) --- 使用分布式 RPC 框架实现参数服务器 目录 [源码解析] PyTorch 分布式(15) --- 使用分布式 RPC 框架实现参数服务器 0x00 摘要 0x01 综述 0x02 基础网络 0x03 辅助函数 0x04 启动 4.1 启动方式 4.2 启动脚本 4.3 启动参数服务器 4.4 启动worker 4.5 建立参数服务器 0x05 TrainerNet 5.1 总体代码 5.2 生成参数服务器 5.3 建立rref 5.4 前向…
[源码解析]机器学习参数服务器ps-lite(4) ----- 应用节点实现 目录 [源码解析]机器学习参数服务器ps-lite(4) ----- 应用节点实现 0x00 摘要 0x01 基础类 1.1 Range 1.2 TreadsafeQueue 0x02 SimpleApp 2.1 概述 2.2 定义 2.2.1 支撑类 2.2.2 成员变量 2.3 功能函数 0x03 KVServer 3.1 定义 3.2 功能函数 3.2.1 Response 3.2.2 Process 3.2.3…
[源码解析] 机器学习参数服务器 Paracel (2)-----SSP实现 目录 [源码解析] 机器学习参数服务器 Paracel (2)-----SSP实现 0x00 摘要 0x01 背景知识 1.1 异步控制协议 1.2 Straggler 问题 0x02 实现 2.1 ssp_switch 2.2 thrd_exec_ssp 2.3 转换 2.4 逻辑串联 2.4.1 初始化 2.4.2 worker 端 iter_commit 2.4.3 服务端 incr_int 2.4.4 串联 0…
前言 其实Grpc拦截器是我以前研究过,但是我看网上相关C#版本的源码解析相对少一点,所以笔者借这篇文章给大家分享下Grpc拦截器的实现,废话不多说,直接开讲(Grpc的源码看着很方便,包自动都能还原成功..Net源码就硬生啃...弄了半天没还原成功). ps: 本篇文章主要是讲解源码,并不进行举例Demo,所以读者尽量先写一个小Demo,看看生成的代码,然后伴随着看文章. 如果没有用过Grpc的读者,可以先写个小Demo,可以看官网点击这里,主要是查看下通过Proto文件生成的代码的格式. 这…
王家林亲授<DT大数据梦工厂>大数据实战视频 Scala 深入浅出实战经典(1-87讲)完整视频.PPT.代码下载: 百度云盘:http://pan.baidu.com/s/1c0noOt6 腾讯微云:http://url.cn/TnGbdC 360云盘:http://yunpan.cn/cQ4c2UALDjSKy 访问密码 45e2土豆:http://www.tudou.com/programs/view/N9y_okxSJzQ/优酷:http://v.youku.com/v_show/id…
王家林亲授<DT大数据梦工厂>大数据实战视频 Scala 深入浅出实战经典(1-87讲)完整视频.PPT.代码下载:百度云盘:http://pan.baidu.com/s/1c0noOt6 腾讯微云:http://url.cn/TnGbdC 360云盘:http://yunpan.cn/cQ4c2UALDjSKy 访问密码 45e2土豆:http://www.tudou.com/programs/view/IVN4EuFlmKk/优酷:http://v.youku.com/v_show/id_…
[源码解析] 机器学习参数服务器ps-lite 之(1) ----- PostOffice 目录 [源码解析] 机器学习参数服务器ps-lite 之(1) ----- PostOffice 0x00 摘要 0x01 概要 1.1 参数服务器是什么 1.2 历史溯源 1.3 论文架构 1.4 ps-lite发展历程 1.5 ps-lite 系统总体 1.6 基础模块 0x02 系统启动 2.1 如何启动 2.2 启动脚本 2.3 示例程序 0x03 Postoffice 3.1 定义 3.2 ID…
[源码解析] 机器学习参数服务器ps-lite(2) ----- 通信模块Van 目录 [源码解析] 机器学习参数服务器ps-lite(2) ----- 通信模块Van 0x00 摘要 0x01 功能概述 0x02 定义 2.1 UML图 2.2 主要说明 2.3 线程管理 2.4 类定义 0x03 初始化 0x04 接受消息 4.1 后台处理消息线程 4.2 处理函数 4.2.1 控制信息 4.2.2 线程内全局变量 4.2.3 具体实现 4.3 处理 ADD_NODE 消息 4.3.1 注册…
[源码解析] 机器学习参数服务器 Paracel (1)-----总体架构 目录 [源码解析] 机器学习参数服务器 Paracel (1)-----总体架构 0x00 摘要 0x01使用 1.1 配置&启动 1.2 编译 1.3 梯度下降法 1.4 驱动代码 1.5 算法代码 1.5.1 类定义 1.5.2 主体代码 1.5.3 Agd算法 1.6 小结 0x02 启动 2.1 python脚本 prun.py 2.1.1 主体函数 2.1.2 starter函数 2.2 可执行程序 start…
本文是系列文章<Maven 源码解析:依赖调解是如何实现的?>第六篇,主要介绍 dependencyManagement 版本锁定原则.请按顺序阅读其他系列文章,系列文章总目录参见:https://www.cnblogs.com/xiaoxi666/p/15583241.html. 场景 我们在根模块 mavenDependencyDemo 中,用 dependencyManagement 的形式直接指定 X 的版本为 2.0.同时,A 依赖 C,而 C 依赖了 X(1.0).我们观察下,最终…
[源码解析] PyTorch 流水线并行实现 (1)--基础知识 目录 [源码解析] PyTorch 流水线并行实现 (1)--基础知识 0x00 摘要 0x01 历史 1.1 GPipe 1.2 torchgpipe 1.3 fairscale 1.4 PyTorch 1.5 基础版本 0x02 基础知识 2.1 流水线并行 2.2 Checkpointing 2.2.1 基本概念 2.2.2 使用 2.2.3 实现概述 2.3 微批次的数目 2.4 检查重计算 0x03 使用 3.1 示例…
[源码解析] 模型并行分布式训练Megatron (5) --Pipedream Flush 目录 [源码解析] 模型并行分布式训练Megatron (5) --Pipedream Flush 0x00 摘要 0x01 背景 0x02 论文 2.1 引论 2.2 背景 2.3 流水线权重问题 2.3.1 问题1 2.3.2 问题2 2.3.3 问题3 2.4 PipeDream-2BW 系统设计 2.4.1 GPipe 2.4.2 Double-Buffered Weight Updates (…
[源码解析] 深度学习分布式训练框架 horovod (18) --- kubeflow tf-operator 目录 [源码解析] 深度学习分布式训练框架 horovod (18) --- kubeflow tf-operator 0x00 摘要 0x01 背景知识 1.1 Kubernetes 1.2 容器作为调度单元 1.3 Kubeflow 1.4 Tensorflow on Kubeflow 1.5 Operator 1.6 TF-Operator 0x02 TensorFlow 分布…
[源码解析] PyTorch 流水线并行实现 (2)--如何划分模型 目录 [源码解析] PyTorch 流水线并行实现 (2)--如何划分模型 0x00 摘要 0x01 问题 0x01 自动平衡 1.1 Automatic Balancing 1.2 基础函数/函数 1.2.1 Batch 1.2.2 layerwise_sandbox 1.2.3 detach 1.3 据计算时间来平衡 1.4 据内存大小来平衡 1.5 分割算法 0x02 模型划分 2.1 调用 2.2 GPipe构建 2.…