摘要:常规的神经网络权重是一个确定的值,贝叶斯神经网络(BNN)中,将权重视为一个概率分布.BNN的优化常常依赖于重参数技巧(reparameterization trick),本文对该优化方法进行概要介绍. 论文地址:http://proceedings.mlr.press/v37/blundell15.pdf 网络权重的点估计 常规神经网络可以基于MLE或MAP对权重作点估计. 基于MLE(maximum likelihood estimation): 基于MAP(maximum a pos…
前言 最近项目需要一个常驻内存的脚本来执行队列程序,脚本完成后发现Mysql自动重连部分存在内存溢出,导致运行一段时间后,会超出PHP内存限制退出 排查 发现脚本存在内存溢出后排查了一遍代码,基本确认内存溢出在Mysql查询部分. 如果不确认也可以把不必要的模块去掉,从最基本的业务开始测,如果没有内存泄露,则继续增加模块,基本很快就能定位到内存泄露处的代码 解决 我使用的是PHP7.2,所以mysql查询部分使用了PDO,但是PDO并没有提供关闭连接的方法,只是说将连接connection赋值为…
目录 1. 概述 2. 重排序 2-1. as-if-serial语义 2-2. 重排序的种类 2-3. 从Java源代码到最终实际执行的指令序列, 会分别经历下面3中重排序. 3. 内存屏障类型 3-1. 处理器的重排序规则 3-2. 内存屏障类型表 4. 总结 1. 概述 在执行程序时, 为了提高性能, 编译器和处理器常常会对指令做重排序. 为了实现某些功能有时会禁止某些重排序, 由此引入了内存屏障. 2. 重排序 重排序虽然可以提高程序性能, 但是编译器和处理器不会改变存在数据依赖关系的两…
论文提出了结合注意力卷积的二叉神经树进行弱监督的细粒度分类,在树结构的边上结合了注意力卷积操作,在每个节点使用路由函数来定义从根节点到叶子节点的计算路径,结合所有叶子节点的预测值进行最终的预测,论文的创意和效果来看都十分不错   来源:晓飞的算法工程笔记 公众号 论文: Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization 论文地址:https://arxiv.org/abs/1909.…
学习率是深度学习中的一个重要超参数,选择合适的学习率能够帮助模型更好地收敛. 本文主要介绍深度学习训练过程中的6种学习率衰减策略以及相应的Pytorch实现. 1. StepLR 按固定的训练epoch数进行学习率衰减. 举例说明: # lr = 0.05 if epoch < 30 # lr = 0.005 if 30 <= epoch < 60 # lr = 0.0005 if 60 <= epoch < 90 在上述例子中,每30个epochs衰减十倍学习率. 计算公式…
实验时要对多个NN模型进行对比,依次加载直到第8个模型时,发现运行速度明显变慢而且电脑开始卡顿,查看内存占用90+%. 原因:使用过的NN模型还会保存在内存,继续加载一方面使新模型加载特别特别慢,另一方面是模型计算速度也会下降很多. 解决方法:加载新模型之前把旧的模型撤掉: tf.reset_default_graph() reset后加载和计算速度明显提升,亲测有效 参考: tensorflow 多个模型测试阶段速度越来越慢问题的解决方法…
题目描述 输入一个int型的正整数,计算出该int型数据在内存中存储时1的个数. 输入描述: 输入一个整数(int类型) 输出描述: 这个数转换成2进制后,输出1的个数 示例1 输入 5 输出 2 Python code: num = int(input().strip()) '))…
  之前看MADDPG论文的时候,作者提到在离散的信息交流环境中,使用了Gumbel-Softmax estimator.于是去搜了一下,发现该技巧应用甚广,如深度学习中的各种GAN.强化学习中的A2C和MADDPG算法等等.只要涉及在离散分布上运用重参数技巧时(re-parameterization),都可以试试Gumbel-Softmax Trick.   这篇文章是学习以下链接之后的个人理解,内容也基本出于此,需要深入理解的可以自取. The Humble Gumbel Distribut…
前言: 最近拿到一块jetson nano 2GB版本的板子,折腾了一下,从烧录镜像.修改配件等,准备一篇开箱基础文章给大家介绍一下这块AI开发板. 作者:良知犹存 转载授权以及围观:欢迎关注微信公众号:羽林君 或者添加作者个人微信:become_me Jetson nano初步介绍: Jetson Nano是Nvidia在TX2和Xavier获得成功后推出的低配版GPU运算平台.在官方的资料上,Jetson Nano公布的参数如下: 技术规格: 包含了一块128核Maxwell架构的GPU,虽…
算算自己大概面试了近十家公司,也拿到了几个Offer,现在面试告一段落,简单总结下面试经验. 我现在主要的方向是Java服务端开发,把遇到的问题和大家分享一下,也谈谈关于技术人员如何有方向的提高自己,做到有的放矢. 面试遇到的问题 百度 百度面了两次,分别是百度糯米和金融事业部,百度目前只有这两个部门的招聘岗位和我比较匹配.面试都在西二旗的百度新总部,园区还在施工,离地铁也比较远,需要打车过去. 面试官自带电脑,整个面试过程都在记录,首先详细询问了最近一份工作项目的架构和工作内容,面试主要围绕工…