使用CNN做文本分类——将图像2维卷积换成1维

使用CNN做文本分类

    from __future__ import division, print_function, absolute_import

    import tensorflow as tf

    import tflearn

    from tflearn.layers.core import input_data, dropout, fully_connected

    from tflearn.layers.conv import conv_1d, global_max_pool

    from tflearn.layers.merge_ops import merge

    from tflearn.layers.estimator import regression

    from tflearn.data_utils import to_categorical, pad_sequences

    from tflearn.datasets import imdb

    import pickle

    import numpy as np

    """

    还是加载imdb.pkl数据

    """

    train, test, _ = imdb.load_data(path='imdb.pkl', n_words=10000,

                                    valid_portion=0.1)

    trainX, trainY = train

    testX, testY = test

    """

    转化为固定长度的向量，这里固定长度为100

    """

    trainX = pad_sequences(trainX, maxlen=100, value=0.)

    testX = pad_sequences(testX, maxlen=100, value=0.)

    """

    二值化向量

    """

    trainY = to_categorical(trainY, nb_classes=2)

    testY = to_categorical(testY, nb_classes=2)

    """

    构建卷积神经网络，这里卷积神经网网络为1d卷积

    """

    network = input_data(shape=[None, 100], name='input')

    network = tflearn.embedding(network, input_dim=10000, output_dim=128)

    branch1 = conv_1d(network, 128, 3, padding='valid', activation='relu', regularizer="L2")

    branch2 = conv_1d(network, 128, 4, padding='valid', activation='relu', regularizer="L2")

    branch3 = conv_1d(network, 128, 5, padding='valid', activation='relu', regularizer="L2")

    network = merge([branch1, branch2, branch3], mode='concat', axis=1)

    network = tf.expand_dims(network, 2)

    network = global_max_pool(network)

    network = dropout(network, 0.5)

    network = fully_connected(network, 2, activation='softmax')

    network = regression(network, optimizer='adam', learning_rate=0.001,

                         loss='categorical_crossentropy', name='target')

    """

    训练开始

    """

    model = tflearn.DNN(network, tensorboard_verbose=0)

    model.fit(trainX, trainY, n_epoch = 1, shuffle=True, validation_set=(testX, testY), show_metric=True, batch_size=32)

    """

    模型保存

    """

    model.save("cnn.model")

    """

    做测试使用

    """

    test=np.linspace(1,101,100).reshape(1,100)

    print("测试结果：",model.predict(test))

模型训练结果以及模型保存情况:

    Training Step: 697  | total loss: 0.40838 | time: 79.960s

    | Adam | epoch: 001 | loss: 0.40838 - acc: 0.8247 -- iter: 22304/22500

    Training Step: 698  | total loss: 0.39128 | time: 80.112s

    | Adam | epoch: 001 | loss: 0.39128 - acc: 0.8329 -- iter: 22336/22500

    Training Step: 699  | total loss: 0.38896 | time: 80.298s

    | Adam | epoch: 001 | loss: 0.38896 - acc: 0.8402 -- iter: 22368/22500

    Training Step: 700  | total loss: 0.39468 | time: 80.456s

    | Adam | epoch: 001 | loss: 0.39468 - acc: 0.8343 -- iter: 22400/22500

    Training Step: 701  | total loss: 0.39380 | time: 80.640s

    | Adam | epoch: 001 | loss: 0.39380 - acc: 0.8353 -- iter: 22432/22500

    Training Step: 702  | total loss: 0.38980 | time: 80.787s

    | Adam | epoch: 001 | loss: 0.38980 - acc: 0.8392 -- iter: 22464/22500

    Training Step: 703  | total loss: 0.39020 | time: 80.970s

    | Adam | epoch: 001 | loss: 0.39020 - acc: 0.8397 -- iter: 22496/22500

    Training Step: 704  | total loss: 0.38543 | time: 82.891s

    | Adam | epoch: 001 | loss: 0.38543 - acc: 0.8370 | val_loss: 0.44625 - val_acc: 0.7880 -- iter: 22500/22500

    --

    测试结果： [[ 0.77064246  0.2293576 ]]

加载模型并做预测:

    import tensorflow as tf

    import numpy as np

    import tflearn

    from tflearn.layers.core import input_data, dropout, fully_connected

    from tflearn.layers.conv import conv_1d, global_max_pool

    from tflearn.layers.merge_ops import merge

    from tflearn.layers.estimator import regression

    """

    跟训练模型的网络结构一样

    """

    network = input_data(shape=[None, 100], name='input')

    network = tflearn.embedding(network, input_dim=10000, output_dim=128)

    branch1 = conv_1d(network, 128, 3, padding='valid', activation='relu', regularizer="L2")

    branch2 = conv_1d(network, 128, 4, padding='valid', activation='relu', regularizer="L2")

    branch3 = conv_1d(network, 128, 5, padding='valid', activation='relu', regularizer="L2")

    network = merge([branch1, branch2, branch3], mode='concat', axis=1)

    network = tf.expand_dims(network, 2)

    network = global_max_pool(network)

    network = dropout(network, 0.5)

    network = fully_connected(network, 2, activation='softmax')

    network = regression(network, optimizer='adam', learning_rate=0.001,

                         loss='categorical_crossentropy', name='target')

    """

    加载模型做预测

    """

    model = tflearn.DNN(network)

    model.load("cnn.model")

    test=np.linspace(1,101,100).reshape(1,100)

    # Predict  [[ 0.7725634   0.22743654]]

    prediction = model.predict(test)

    print("模型预测结果",prediction)

结果：

    2017-10-15 19:35:14.940689: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use FMA instructions, but these are available on your machine and could speed up CPU computations.

    模型预测结果 [[ 0.77064246  0.2293576 ]]

    Process finished with exit code 0

基于tflearn高阶api怎么做文本分类基本上完成

使用CNN做文本分类——将图像2维卷积换成1维的更多相关文章

《机器学习系统设计》之应用scikit-learn做文本分类（上）
前言: 本系列是在作者学习<机器学习系统设计>([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理.到特征project,再到模型选择,把机器学习解决这个 ...
深度学习原理与框架-CNN在文本分类的应用 1.tf.nn.embedding_lookup(根据索引数据从数据中取出数据) 2.saver.restore(加载sess参数)
1. tf.nn.embedding_lookup(W, X) W的维度为[len(vocabulary_list), 128], X的维度为[?, 8],组合后的维度为[?, 8, 128] 代码说 ...
用keras的cnn做人脸分类
keras介绍 Keras是一个简约,高度模块化的神经网络库.采用Python / Theano开发. 使用Keras如果你需要一个深度学习库: 可以很容易和快速实现原型(通过总模块化,极简主义,和可 ...
应用scikit-learn做文本分类
文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言 ...
应用scikit-learn做文本分类（转）
文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言 ...
Tensorflor实现文本分类
Tensorflor实现文本分类下面我们使用CNN做文本分类 cnn实现文本分类的原理下图展示了如何使用cnn进行句子分类.输入是一个句子,为了使其可以进行卷积,首先需要将其转化为向量表示,通常使 ...
用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践
https://zhuanlan.zhihu.com/p/25928551 近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总结下文本分类 ...
[转] 用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践
转自知乎上看到的一篇很棒的文章:用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文 ...
CNN文本分类
CNN用于文本分类本就是一个不完美的解决方案,因为CNN要求输入都是一定长度的,而对于文本分类问题,文本序列是不定长的,RNN可以完美解决序列不定长问题, 因为RNN不要求输入是一定长度的.那么对于C ...

随机推荐

Scrapy中的UA池，代理池，以及selenium的应用
UA池代理池 selenium在Scrapy中的应用 UA池 - 下载中间件: - 下载中间件(Downloader Middlewares) 位于scrapy引擎和下载器之间的一层组件. - 作用 ...
WPF黑色背景下常用控件样式
平时工作用自己整理的代码等找到合适的上传空间在进行同步
Solr.NET快速入门(四)【相似查询,拼写检查】
相似查询此功能会返回原始查询结果中返回的每个文档的类似文档列表. 参数通过QueryOptions的MoreLikeThis属性定义. 示例:搜索"apache",为结果中的每个 ...
web拼图错误分析
老师要求用web制作一个拼图游戏. 发现的问题:点击随机生成拼图的按钮后,打乱的图片会出现无法还原的情况. 发现过程:每次生成一个拼图后会测试它怎么拼回去,结果发现有时候拼不回去. 数学原理:如果两个 ...
Android Drawable之getIntrinsicWidth()和getIntrinsicHeight()
在Android的开发中,凡是需要画图的地方大都离不开类Drawable.Android的官方文档中介绍这个类就是被设计用来表示可以被画的东西.A Drawable is a ge ...
Android WiFi热点完全研究(自定义创建、跳转系统界面设置、读取配置、切换，Android6.0适配)
前言: WiFi热点设置页面的安全性选项在Android 4.x上有“无”.“WPA PSK”.“WPA2 PSK”三个选项,在Android 5.0(含)之后去掉了WPA PSK选项(部分手机厂家会 ...
Android开发笔记（7）——Intent启用应用软件
转载请注明:http://www.cnblogs.com/igoslly/p/6844154.html Intent启用应用软件 intent可以用来要求其他应用组件完成特定工作,如相机.电话.地图等 ...
MFC常用控件之列表视图控件(List Control)
近期学习了鸡啄米大神的博客,对其中的一些知识点做了一些自己的总结.不过,博客内容大部分来自鸡啄米.因此,这个博客算是转载博客,只是加了一些我自己的理解而已.若想学习鸡啄米大神的博客总结,请点击连接:h ...
PLSQL 11注册码
plsql 11 注册码:Product Code:4t46t6vydkvsxekkvf3fjnpzy5wbuhphqzserial Number:601769 password:xs374ca
前端自动化构建yeoman
前端自动化可分为: yo(脚手架工具).grunt(构建工具).bower(包管理器). OMAN的特性 http://yeoman.io/learning/ 闪电般的初始化:项目开始阶段,可以基 ...

使用CNN做文本分类——将图像2维卷积换成1维

使用CNN做文本分类——将图像2维卷积换成1维的更多相关文章

随机推荐

热门专题