影评文本分类 文本分类(Text classification):https://www.tensorflow.org/tutorials/keras/basic_text_classification主要步骤: 1.加载IMDB数据集 2.探索数据:了解数据格式.将整数转换为字词 3.准备数据 4.构建模型:隐藏单元.损失函数和优化器 5.创建验证集 6.训练模型 7.评估模型 8.可视化:创建准确率和损失随时间变化的图 IMDB数据集 包含来自互联网电影数据库的50000条影评文本 http…
基本分类 基本分类(Basic classification):https://www.tensorflow.org/tutorials/keras/basic_classification Fashion MNIST数据集 经典 MNIST 数据集(常用作计算机视觉机器学习程序的“Hello, World”入门数据集)的简易替换 包含训练数据60000个,测试数据10000个,每个图片是28x28像素的灰度图像,涵盖10个类别 https://keras.io/datasets/#fashio…
用卷积神经网络基于 Tensorflow 实现的中文文本分类 项目地址: https://github.com/fendouai/Chinese-Text-Classification 欢迎提问:http://tensorflow123.com/ 这个项目是基于以下项目改写: cnn-text-classification-tf 主要的改动: 兼容 tensorflow 1.2 以上 增加了中文数据集 增加了中文处理流程 特性: 兼容最新 TensorFlow 中文数据集 基于 jieba 的中…
基本回归 回归(Regression):https://www.tensorflow.org/tutorials/keras/basic_regression 主要步骤:数据部分 获取数据(Get the data) 清洗数据(Clean the data) 划分训练集和测试集(Split the data into train and test) 检查数据(Inspect the data) 分离标签(Split features from labels) 规范化数据(Normalize th…
下面是分类的主函数入口 #! /usr/bin/env python import tensorflow as tf import numpy as np import os import time import datetime import data_helpers from text_cnn import TextCNN from tensorflow.contrib import learn # Parameters # =================================…
保存和恢复模型(Save and restore models) 官网示例:https://www.tensorflow.org/tutorials/keras/save_and_restore_models 在训练期间保存检查点 在训练期间或训练结束时自动保存检查点.权重存储在检查点格式的文件集合中,这些文件仅包含经过训练的权重(采用二进制格式).可以使用经过训练的模型,而无需重新训练该模型,或从上次暂停的地方继续训练,以防训练过程中断 检查点回调用法:创建检查点回调,训练模型并将ModelC…
过拟合与欠拟合(Overfitting and underfitting) 官网示例:https://www.tensorflow.org/tutorials/keras/overfit_and_underfit主要步骤: 演示过拟合 - 创建基准模型 - 创建一个更小的模型 - 创建一个更大的模型 - 绘制训练损失和验证损失函数 策略 - 添加权重正则化 - 添加丢弃层 一些知识点 过拟合 在训练集上可以实现很高的准确率,但无法很好地泛化到测试数据(或之前未见过的数据).可能导致欠拟合的原因:…
from:http://deeplearning.lipingyang.org/tensorflow-examples-text/ TensorFlow examples (text-based) This page provides links to text-based examples (including code and tutorial for most examples) using TensorFlow. (Stay tuned, as I keep updating the p…
代码已上传到github:https://github.com/taishan1994/tensorflow-text-classification 往期精彩: 利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 利用RNN进行中文文本分类(数据集是复旦中文语料) 利用CNN进行中文文本分类(数据集是复旦中文语料) 利用transformer进行中文文本分类(数据集是复旦中文语料) 基于tensorflow的中文文本分类 数据集:复旦中文语料,包含20类数据集下载地址:h…
这里做了一些小的修改,感谢谷歌rd的帮助,使得能够统一处理dense的数据,或者类似文本分类这样sparse的输入数据.后续会做进一步学习优化,比如如何多线程处理. 具体如何处理sparse 主要是使用embedding_lookup_sparse,参考 https://github.com/tensorflow/tensorflow/issues/342 两个文件 melt.py binary_classification.py 代码和数据已经上传到 https://github.com/ch…