使用CNN做文本分类——将图像2维卷积换成1维

使用CNN做文本分类

    from __future__ import division, print_function, absolute_import

    import tensorflow as tf

    import tflearn

    from tflearn.layers.core import input_data, dropout, fully_connected

    from tflearn.layers.conv import conv_1d, global_max_pool

    from tflearn.layers.merge_ops import merge

    from tflearn.layers.estimator import regression

    from tflearn.data_utils import to_categorical, pad_sequences

    from tflearn.datasets import imdb

    import pickle

    import numpy as np

    """

    还是加载imdb.pkl数据

    """

    train, test, _ = imdb.load_data(path='imdb.pkl', n_words=10000,

                                    valid_portion=0.1)

    trainX, trainY = train

    testX, testY = test

    """

    转化为固定长度的向量，这里固定长度为100

    """

    trainX = pad_sequences(trainX, maxlen=100, value=0.)

    testX = pad_sequences(testX, maxlen=100, value=0.)

    """

    二值化向量

    """

    trainY = to_categorical(trainY, nb_classes=2)

    testY = to_categorical(testY, nb_classes=2)

    """

    构建卷积神经网络，这里卷积神经网网络为1d卷积

    """

    network = input_data(shape=[None, 100], name='input')

    network = tflearn.embedding(network, input_dim=10000, output_dim=128)

    branch1 = conv_1d(network, 128, 3, padding='valid', activation='relu', regularizer="L2")

    branch2 = conv_1d(network, 128, 4, padding='valid', activation='relu', regularizer="L2")

    branch3 = conv_1d(network, 128, 5, padding='valid', activation='relu', regularizer="L2")

    network = merge([branch1, branch2, branch3], mode='concat', axis=1)

    network = tf.expand_dims(network, 2)

    network = global_max_pool(network)

    network = dropout(network, 0.5)

    network = fully_connected(network, 2, activation='softmax')

    network = regression(network, optimizer='adam', learning_rate=0.001,

                         loss='categorical_crossentropy', name='target')

    """

    训练开始

    """

    model = tflearn.DNN(network, tensorboard_verbose=0)

    model.fit(trainX, trainY, n_epoch = 1, shuffle=True, validation_set=(testX, testY), show_metric=True, batch_size=32)

    """

    模型保存

    """

    model.save("cnn.model")

    """

    做测试使用

    """

    test=np.linspace(1,101,100).reshape(1,100)

    print("测试结果：",model.predict(test))

模型训练结果以及模型保存情况:

    Training Step: 697  | total loss: 0.40838 | time: 79.960s

    | Adam | epoch: 001 | loss: 0.40838 - acc: 0.8247 -- iter: 22304/22500

    Training Step: 698  | total loss: 0.39128 | time: 80.112s

    | Adam | epoch: 001 | loss: 0.39128 - acc: 0.8329 -- iter: 22336/22500

    Training Step: 699  | total loss: 0.38896 | time: 80.298s

    | Adam | epoch: 001 | loss: 0.38896 - acc: 0.8402 -- iter: 22368/22500

    Training Step: 700  | total loss: 0.39468 | time: 80.456s

    | Adam | epoch: 001 | loss: 0.39468 - acc: 0.8343 -- iter: 22400/22500

    Training Step: 701  | total loss: 0.39380 | time: 80.640s

    | Adam | epoch: 001 | loss: 0.39380 - acc: 0.8353 -- iter: 22432/22500

    Training Step: 702  | total loss: 0.38980 | time: 80.787s

    | Adam | epoch: 001 | loss: 0.38980 - acc: 0.8392 -- iter: 22464/22500

    Training Step: 703  | total loss: 0.39020 | time: 80.970s

    | Adam | epoch: 001 | loss: 0.39020 - acc: 0.8397 -- iter: 22496/22500

    Training Step: 704  | total loss: 0.38543 | time: 82.891s

    | Adam | epoch: 001 | loss: 0.38543 - acc: 0.8370 | val_loss: 0.44625 - val_acc: 0.7880 -- iter: 22500/22500

    --

    测试结果： [[ 0.77064246  0.2293576 ]]

加载模型并做预测:

    import tensorflow as tf

    import numpy as np

    import tflearn

    from tflearn.layers.core import input_data, dropout, fully_connected

    from tflearn.layers.conv import conv_1d, global_max_pool

    from tflearn.layers.merge_ops import merge

    from tflearn.layers.estimator import regression

    """

    跟训练模型的网络结构一样

    """

    network = input_data(shape=[None, 100], name='input')

    network = tflearn.embedding(network, input_dim=10000, output_dim=128)

    branch1 = conv_1d(network, 128, 3, padding='valid', activation='relu', regularizer="L2")

    branch2 = conv_1d(network, 128, 4, padding='valid', activation='relu', regularizer="L2")

    branch3 = conv_1d(network, 128, 5, padding='valid', activation='relu', regularizer="L2")

    network = merge([branch1, branch2, branch3], mode='concat', axis=1)

    network = tf.expand_dims(network, 2)

    network = global_max_pool(network)

    network = dropout(network, 0.5)

    network = fully_connected(network, 2, activation='softmax')

    network = regression(network, optimizer='adam', learning_rate=0.001,

                         loss='categorical_crossentropy', name='target')

    """

    加载模型做预测

    """

    model = tflearn.DNN(network)

    model.load("cnn.model")

    test=np.linspace(1,101,100).reshape(1,100)

    # Predict  [[ 0.7725634   0.22743654]]

    prediction = model.predict(test)

    print("模型预测结果",prediction)

结果：

    2017-10-15 19:35:14.940689: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use FMA instructions, but these are available on your machine and could speed up CPU computations.

    模型预测结果 [[ 0.77064246  0.2293576 ]]

    Process finished with exit code 0

基于tflearn高阶api怎么做文本分类基本上完成

使用CNN做文本分类——将图像2维卷积换成1维的更多相关文章

《机器学习系统设计》之应用scikit-learn做文本分类（上）
前言: 本系列是在作者学习<机器学习系统设计>([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理.到特征project,再到模型选择,把机器学习解决这个 ...
深度学习原理与框架-CNN在文本分类的应用 1.tf.nn.embedding_lookup(根据索引数据从数据中取出数据) 2.saver.restore(加载sess参数)
1. tf.nn.embedding_lookup(W, X) W的维度为[len(vocabulary_list), 128], X的维度为[?, 8],组合后的维度为[?, 8, 128] 代码说 ...
用keras的cnn做人脸分类
keras介绍 Keras是一个简约,高度模块化的神经网络库.采用Python / Theano开发. 使用Keras如果你需要一个深度学习库: 可以很容易和快速实现原型(通过总模块化,极简主义,和可 ...
应用scikit-learn做文本分类
文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言 ...
应用scikit-learn做文本分类（转）
文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言 ...
Tensorflor实现文本分类
Tensorflor实现文本分类下面我们使用CNN做文本分类 cnn实现文本分类的原理下图展示了如何使用cnn进行句子分类.输入是一个句子,为了使其可以进行卷积,首先需要将其转化为向量表示,通常使 ...
用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践
https://zhuanlan.zhihu.com/p/25928551 近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总结下文本分类 ...
[转] 用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践
转自知乎上看到的一篇很棒的文章:用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文 ...
CNN文本分类
CNN用于文本分类本就是一个不完美的解决方案,因为CNN要求输入都是一定长度的,而对于文本分类问题,文本序列是不定长的,RNN可以完美解决序列不定长问题, 因为RNN不要求输入是一定长度的.那么对于C ...

随机推荐

Selenium的文件上传JAVA脚本
在写文件上传脚本的时候,遇到了很多问题,包括元素定位,以及上传操作,现在总结下来以下几点: 1. 上传的控件定位要准确,必要时要进行等待 WebElement adFileUpload = drive ...
基于 Web 的 Go 语言 IDE - Wide 1.4.0 发布！
Wide 是什么 Wide 是一个基于 Web 的 Go 语言团队 IDE . 在线开发:打开浏览器就可以进行开发.全快捷键智能提示:代码自动完成.查看表达式.编译反馈. Lint 实时运行:极速编 ...
C# 学习笔记_类
定义:将成员及方法封装到类中,类的实例则称为对象. 结构:属性,类修饰符,class,类名,{类体} 类修饰符:new,public,protected,internal,private,abstra ...
OpenCV_Python教程系列！
这个是作者的总结系列!赞一个! 原文链接:http://blog.csdn.net/sunny2038/article/details/9057415 在python中使用OpenCV:http:// ...
Linux终端 Tab 补全命令
1. vi编辑器打开 /etc/bash.bashrc文件 vi /etc/bash.bashrc 2.找到文件中的下列代码 3.将注释符号#去掉,即改成 4.最后 source一下 /etc/bas ...
Flask框架函数
title: flask学习笔记 subtitle: 1. flask框架函数 date: 2018-12-14 10:17:28 --- Flask学习学习Miguel Grinberg的2017 ...
在Linux Centos 7.2 上安装指定版本Docker 17.03
相关资料链接: https://docs.docker.com/install/linux/docker-ce/centos/#install-docker-ce 先清空下“历史” yum insta ...
Maven安装+配置
原先的项目构建属于Ant,就是先export成jar文件,然后引用. Maven依赖一定是引用本地仓库的,所以会先从中央仓库把依赖下载下来存到本地.和NuGet是一样的. 下载地址选择一个zip, ...
Unity3D_脚本_获取对象的位置_碰撞后加一段音乐_旋转对象_使物体随机运动
获取对象的位置(Position) 在代码中加上 public Rigidbody cd;cd = GetComponent<Rigidbody>();Vector3 m=cd.trans ...
破解sublim_Text3
1.更改hosts文件 windows系统的hosts文件在C:\Windows\System32\drivers\etc 路径下,其他系统请自行百度在hosts文件中加入下面两行: 127.0.0 ...

使用CNN做文本分类——将图像2维卷积换成1维

使用CNN做文本分类——将图像2维卷积换成1维的更多相关文章

随机推荐

热门专题