Keras split train test set when using ImageDataGenerator I have a single directory which contains sub-folders (according to labels) of images. I want to split this data into train and test set while using ImageDataGenerator in Keras. Although model.f…
引自:http://blog.csdn.net/sinat_26917383/article/details/72982230 之前在博客<keras系列︱图像多分类训练与利用bottleneck features进行微调(三)>一直在倒腾VGG16的fine-tuning,然后因为其中的Flatten层一直没有真的实现最后一个模块的fine-tuning. 看到github上有一份InceptionV3的fine-tuning并且可以实现. 我看到的keras微调的方式分为以下两种: fin…
引自:http://blog.csdn.net/sinat_26917383/article/details/72861152 中文文档:http://keras-cn.readthedocs.io/en/latest/  官方文档:https://keras.io/  文档主要是以keras2.0. 训练.训练主要就”练“嘛,所以堆几个案例就知道怎么做了. . . Keras系列: 1.keras系列︱Sequential与Model模型.keras基本结构功能(一) 2.keras系列︱Ap…
第一部分:安装 由于我的电脑之前已经已经配置好了caffe,因此有关python的一切相关包都已经安装完成.因此,即使不用Anaconda安装依然很简单. sudo pip install tensorflow sudo pip install keras 测试: python from keras.models import Sequential 第二部分:如何用keras从本地中读取图片,并做一个二分类的神经网络,直接贴出代码: # coding=utf-8 ## import os ##和…
这里,我们介绍的是一个猫狗图像识别的一个任务.数据可以从kaggle网站上下载.其中包含了25000张毛和狗的图像(每个类别各12500张).在小样本中进行尝试 我们下面先尝试在一个小数据上进行训练,首先创建三个子集:每个类别各1000个样本的训练集.每个类别各500个样本的验证集和每个类别各500个样本的测试集. import os, shutil original_dataset_dir = '/media/erphm/DATA/kaggle猫狗识别/train'    # 原始文解压目录b…
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识!…
用keras搭好模型架构之后的下一步,就是执行编译操作.在编译时,经常需要指定三个参数 loss optimizer metrics 这三个参数有两类选择: 使用字符串 使用标识符,如keras.losses,keras.optimizers,metrics包下面的函数 例如: sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True) model.compile(loss='categorical_crossentropy', opt…
1.数据集加载 if FLAGS.normal: assert(NUM_POINT<=10000) DATA_PATH = os.path.join(ROOT_DIR, 'data/modelnet40_normal_resampled') TRAIN_DATASET = modelnet_dataset.ModelNetDataset(root=DATA_PATH, npoints=NUM_POINT, split='train', normal_channel=FLAGS.normal, b…
1.作者可能把scannet数据集分成了训练集和测试集并处理成了.pickle文件. 2.在代码运行过程中,作者从.pickle文件中读出训练集1201个场景的x.y.z坐标和测试集312个场景的x.y.z坐标. 3.考虑把点存到.txt文件中,用cloudcompare可视化一下. 2--地板 3--椅子 8--沙发 20--靠枕 单独存入训练数据到txt文件 : TRAIN_DATASET = scannet_dataset.ScannetDataset(root=DATA_PATH, np…
先划分数据集程序训练集中猫狗各12500张现在提取1000张做为训练集,500张作为测试集,500张作为验证集: # -*- coding: utf-8 -*-import os, shutil original_dataset_dir = '/home/duchao/projects(my)/keras/kagge/train' # 原始文解压目录base_dir = '/home/duchao/projects(my)/keras/kagge/small_data'# 创建新的文件夹os.m…
0 前言 近些年来,所谓的人工智能也就是AI. 在媒体的炒作下,变得神乎其神,但实际上,类似于图片识别的AI,其原理只不过是数学的应用. 线性代数,概率论,微积分(著名的反向传播算法). 大家觉得这些东西离自己很远,没错! 这东西底层实在是很难,斯坦福公开课网站上(Coursera), 有吴恩达教授的机器学习课程,需要利用Matlab用向量化的编程方式完成线性回归,逻辑回归,甚至是神经网络,以及反向传播代码.这些内容无论在任何方面都是艰涩的难以理解的. 而这只能算是人工智能机器学习的入门课程.本…
迁移学习基本概念 迁移学习是这两年比较火的一个话题,主要原因是在当前的机器学习中,样本数据的获取是成本最高的一块.而迁移学习可以有效的把原有的学习经验(对于模型就是模型本身及其训练好的权重值)带入到新的领域,从而不需要过多的样本数据,也能达到大批量数据所达成的效果,进一步节省了学习的计算量和时间. MobileNet V2是由谷歌在2018年初发布的一个视觉模型,在Keras中已经内置的并使用ImageNet完成了训练,可以直接拿来就用,这个我们在本系列第五篇中已经提过了.MobileNet V…
本节介绍基于Keras的CNN 卷积神经网络接收形状为 (image_height, image_width, image_channels)的输入张量(不包括批量维度),宽度和高度两个维度的尺寸通常会随着网络加深而变小.通道数量由传入 Conv2D 层的第一个参数所控制 用卷积神经网络对 MNIST 数字进行分类Demo from keras import layers from keras import models from keras.datasets import mnist from…
目录 1. 流程概述 2. 准备数据集 2.1 Satellite数据集介绍 3. Inception V3网络 4. 训练 4.1 基于Keras微调Inception V3网络 4.2 Keras实时生成批量增强数据 4.3 配置transfer learning & finetune 4.4 执行训练 5. 测试 5.1 对单张图片进行测试 6. 可视化分类界面 6.1 交互界面设计 6.2 后台核心代码:模型加载并分类 6.3 交互界面效果   这篇博客主要是使用Keras框架微调Inc…
TensorFlow Hub 模型复用 TF Hub 网站 打开主页 https://tfhub.dev/ ,在左侧有 Text.Image.Video 和 Publishers 等选项,可以选取关注的类别,然后在顶部的搜索框输入关键字可以搜索模型. TF Hub 安装 是单独的一个库,需要单独安装,安装命令如下: pip install tensorflow-hub TF Hub 模型使用样例 import tensorflow_hub as hub hub_handle = 'https:/…
前文:三分钟快速上手TensorFlow 2.0 (中)——常用模块和模型的部署 TensorFlow 模型导出 使用 SavedModel 完整导出模型 不仅包含参数的权值,还包含计算的流程(即计算图) tf.saved_model.save(model, "保存的目标文件夹名称") 将模型导出为 SavedModel model = tf.saved_model.load("保存的目标文件夹名称") 载入 SavedModel 文件 因为 SavedModel…
本文学习笔记参照来源:https://tf.wiki/zh/basic/basic.html 学习笔记类似提纲,具体细节参照上文链接 一些前置的基础 随机数 tf.random uniform(shape()) 两个元素零向量 tf.zeros(shape=(2)) 2x2常量 tf.constant([1,2],[3,4]) 查看形状.类型.值 A.shape A.dtype A.numpy() 矩阵相加 tf.add(A,B) 矩阵相乘 tf.matmul(A,B) 自动求导机制  tf.G…
1. 预训练的BERT模型 从头开始训练一个BERT模型是一个成本非常高的工作,所以现在一般是直接去下载已经预训练好的BERT模型.结合迁移学习,实现所要完成的NLP任务.谷歌在github上已经开放了预训练好的不同大小的BERT模型,可以在谷歌官方的github repo中下载[1]. 以下是官方提供的可下载版本: 其中L表示的是encoder的层数,H表示的是隐藏层的大小(也就是最后的前馈网络中的神经元个数,等同于特征输出维度). 除此之外,谷歌还提供了BERT-uncased与BERT-c…
本文利用gensim进行LDA主题模型实验,第一部分是基于前文的wiki语料,第二部分是基于Sogou新闻语料. 1. 基于wiki语料的LDA实验 上一文得到了wiki纯文本已分词语料 wiki.zh.seg.utf.txt,去停止词后可进行LDA实验. import codecs from gensim.models import LdaModel from gensim.corpora import Dictionary train = [] stopwords = codecs.open…
recommend li_volleyball 2016年3月20日 library(recommenderlab) ## Warning: package 'recommenderlab' was built under R version 3.2.4 ## Loading required package: Matrix ## Loading required package: registry ## Loading required package: arules ## ## Attach…
recommend li_volleyball 2016年3月20日 library(recommenderlab) library(ggplot2) # data(MovieLense) dim(MovieLense) ## [1] 943 1664 MovieLense ## 943 x 1664 rating matrix of class 'realRatingMatrix' with 99392 ratings. image(sample(MovieLense,500),main="R…
Introduction to Random forest(Simplified) With increase in computational power, we can now choose algorithms which perform very intensive calculations. One such algorithm is “Random Forest”, which we will discuss in this article. While the algorithm…
OpenCV2.3中Random Trees(R.T.)的继承结构: API: CvRTParams 定义R.T.训练用参数,CvDTreeParams的扩展子类,但并不用到CvDTreeParams(单一决策树)所需的所有参数.比如说,R.T.通常不需要剪枝,因此剪枝参数就不被用到.max_depth  单棵树所可能达到的最大深度min_sample_count  树节点持续分裂的最小样本数量,也就是说,小于这个数节点就不持续分裂,变成叶子了regression_accuracy  回归树的终…
一.数据预处理.特征工程 类别变量 labelencoder就够了,使用onehotencoder反而会降低性能.其他处理方式还有均值编码(对于存在大量分类的特征,通过监督学习,生成数值变量).转换处理(低频分类合并).特征构造(结合其他数值变量生成新特征). 二.模型调参 网格调参.随机调参. 模型参数没必要太过于纠结,调参到合适的地步就好了,太过沉迷会导致过拟合. 三.样本划分 一般是对数据集按7:3.8:2.7.5:2.5等划分为训练集和测试集. 更用心一点,把数据集随机划分为k折,以任意…
一.写在前面 fcn是首次使用cnn来实现语义分割的,论文地址:fully convolutional networks for semantic segmentation 实现代码地址:https://github.com/shelhamer/fcn.berkeleyvision.org 全卷积神经网络主要使用了三种技术: 1. 卷积化(Convolutional) 2. 上采样(Upsample) 3. 跳跃结构(Skip Layer) 为了便于理解,我拿最简单的结构voc-fcn-alex…
总结自论文:Faster_RCNN,与Pytorch代码: 代码结构:  simple-faster-rcnn-pytorch.py data __init__.py dataset.py util.py voc_dataset.py misc convert_caffe_pretain.py train_fast.py model utils nms __init__.py _nms_gpu_post.py build.py non_maximum_suppression.py __init_…
R语言:recommenderlab包的总结与应用案例   1. 推荐系统:recommenderlab包整体思路 recommenderlab包提供了一个可以用评分数据和0-1数据来发展和测试推荐算法的框架.它提供了几种基础算法,并可利用注册机制允许用户使用自己的算法recommender包的数据类型采用S4类构造. (1)评分矩阵数据接口:使用抽象的raringMatrix为评分数据提供接口.raringMatrix采用了很多类似矩阵对象的操作,如 dim(),dimnames() ,row…
时间格式的转化 查看数据类型 查看DataFrame的详细信息 填充缺失值 category 数据类型转化 模型参数设定 结论 该项目是针对kaggle中的homesite进行的算法预测,使用xgboost的sklearn接口,进行数据建模,购买预测. import pandas as pd import numpy as np import xgboost as xgb from sklearn.model_selection import StratifiedKFold from sklea…
前文参考: Python爬虫(一)——开封市58同城租房信息 Python爬虫(二)——对开封市58同城出租房数据进行分析 Python爬虫(三)——对豆瓣图书各模块评论数与评分图形化分析 数据的构建 在这张表中我们可以发现这里有5个数据,这里有两个特征(房租是否少于2000,房屋面积是否大于50)来划分这5个出租房是否租借. 现在我们要做的就是是要根据第一个特征,第二个特征还是第三个特征来划分数据,进行分类. def createDataSet(): dataSet = [[1, 1, 'ye…
Dynamic Multimodal Instance Segmentation Guided by Natural Language Queries 2018-09-18 09:58:50 Paper:http://openaccess.thecvf.com/content_ECCV_2018/papers/Edgar_Margffoy-Tuay_Dynamic_Multimodal_Instance_ECCV_2018_paper.pdf GitHub:https://github.com/…