python多标签分类模版

 from sklearn.multioutput import MultiOutputClassifier

 from sklearn.ensemble import RandomForestClassifier

 from sklearn.ensemble import ExtraTreesClassifier

 import numpy as np

 from pandas import read_csv

 import pandas as pd

 root1="F:/goverment/shuili2/techproblem_text_train.csv"

 root2="F:/goverment/shuili2/techproblem_text_test.csv"

 root3="F:/goverment/shuili2/text_train_4problem.csv"

 root4="F:/goverment/shuili2/text_test_4problem.csv"

 '''大类小类一起预测'''

 #root2="./id="+str(id_num)+"_process_data.csv"

 dataset1 = read_csv(root1) #数据转化为数组

 dataset1=dataset1.values

 dataset2 = read_csv(root2) #数据转化为数组

 dataset2=dataset2.values

 X_train=dataset1[:,:28]# 到28之前都是变量

 Y_train=dataset1[:,28:]# 28到之后都是lable

 X_test=dataset2[:,:28]

 Y_test=dataset2[:,28:]

 print('多输出多分类器真实输出分类:\n',Y_train)

 n_samples, n_features = X_train.shape #4000 29

 n_outputs = Y_train.shape[1] # 4000*8

 n_classes = 50 # 每种输出有50种分类

 forest = RandomForestClassifier(n_estimators=500,random_state=1)  # 生成随机森林多分类器

 multi_target_forest = MultiOutputClassifier(forest)  # 构建多输出多分类器

 y_pred = multi_target_forest.fit(X_train, Y_train).predict(X_train)

 print('多输出多分类器预测输出分类:\n',y_pred)

 pp=multi_target_forest.predict(X_test)

 a=pp

 k=0

 for i in range(len(a)):

     if a[i][0]==Y_test[i][0] and a[i][1]==Y_test[i][1] and a[i][2]==Y_test[i][2] and a[i][3]==Y_test[i][3] and a[i][4]==Y_test[i][4] and a[i][5]==Y_test[i][5] and a[i][6]==Y_test[i][6] and a[i][7]==Y_test[i][7]:

         k+=1

 aa=k/1328*1.0

 print(aa)

 '''只预测大类'''

 #root2="./id="+str(id_num)+"_process_data.csv"

 dataset3 = read_csv(root1) #数据转化为数组

 dataset3=dataset3.values

 dataset4 = read_csv(root2) #数据转化为数组

 dataset4=dataset4.values

 X_train_big=dataset3[:,:28]

 Y_train_big=dataset3[:,28:32]

 X_test_big=dataset4[:,:28]

 Y_test_big=dataset4[:,28:32]

 print('只预测大类：多输出多分类器真实输出分类:\n',Y_train_big)

 n_samples, n_features = X_train_big.shape #4000 29

 n_outputs = Y_train_big.shape[1] # 4000*8

 n_classes = 11 # 每种输出有11种分类

 forest = RandomForestClassifier(n_estimators=200,random_state=1)  # 生成随机森林多分类器

 multi_target_forest = MultiOutputClassifier(forest)  # 构建多输出多分类器

 y_pred = multi_target_forest.fit(X_train_big, Y_train_big).predict(X_train_big)

 print('多输出多分类器预测输出分类:\n',y_pred)

 pp=multi_target_forest.predict(X_test_big)

 a=pp

 k=0

 for i in range(len(a)):

     if a[i][0]==Y_test_big[i][0] and a[i][1]==Y_test_big[i][1] and a[i][2]==Y_test_big[i][2] and a[i][3]==Y_test_big[i][3]:

         k+=1

 aa=k/1328*1.0

 print(aa)

 '''只预测小类'''

 #root2="./id="+str(id_num)+"_process_data.csv"

 dataset4 = read_csv(root3) #数据转化为数组

 dataset4=dataset4.values

 dataset5 = read_csv(root4) #数据转化为数组

 dataset5=dataset5.values

 X_train_samll=dataset4[:,:28]

 Y_train_samll=dataset4[:,28:32]

 X_test_samll=dataset5[:,:28]

 Y_test_samll=dataset5[:,28:32]

 print('只预测小类：多输出多分类器真实输出分类:\n',Y_train_samll)

 n_samples, n_features = X_train_samll.shape #4000 29

 n_outputs = Y_train_samll.shape[1] # 4000*4

 n_classes = 61 # 每种输出有61种分类

 forest = RandomForestClassifier(n_estimators=200,random_state=1)  # 生成随机森林多分类器

 multi_target_forest = MultiOutputClassifier(forest)  # 构建多输出多分类器

 y_pred = multi_target_forest.fit(X_train_samll, Y_train_samll).predict(X_train_samll)

 print('多输出多分类器预测输出分类:\n',y_pred)

 pp=multi_target_forest.predict(X_test_samll)

 a=pp

 k=0

 for i in range(len(a)):

     if a[i][0]==Y_test_samll[i][0] and a[i][1]==Y_test_samll[i][1] and a[i][2]==Y_test_samll[i][2] and a[i][3]==Y_test_samll[i][3]:

         k+=1

 aa=k/1328*1.0

 print(aa)

 '''

 from pandas import read_csv

 import pandas as pd

 import numpy as np

 from skmultilearn.problem_transform import BinaryRelevance

 from sklearn.naive_bayes import GaussianNB

 from sklearn.metrics import accuracy_score

 root1="D:/Anaconda3-5.0.1-Windows-x86_64/anaconda/work/shuili2/data.csv"

 #root2="./id="+str(id_num)+"_process_data.csv"

 dataset = read_csv(root1) #数据转化为数组

 dataset=dataset.values

 x_train=dataset[:4000,:29]

 y_train=dataset[:4000,29:]

 x_test=dataset[4000:,:29]

 y_test=dataset[4000:,29:]

 # initialize binary relevance multi-label classifier

 # with a gaussian naive bayes base classifier

 classifier = BinaryRelevance(GaussianNB())

 # train

 classifier.fit(x_train, y_train)

 # predict

 predictions = classifier.predict(x_test)

 accuracy_score(y_test,predictions)

 '''

 '''---------------------------------'''

 '''

 import numpy as np

 import pandas as pd

 from keras.models import Sequential

 from keras.layers import Dense, Dropout

 from keras.wrappers.scikit_learn import KerasClassifier

 from keras.utils import np_utils

 from sklearn.model_selection import train_test_split, KFold, cross_val_score

 from sklearn.preprocessing import LabelEncoder

 from pandas import read_csv

 from sklearn.naive_bayes import GaussianNB

 from sklearn.metrics import accuracy_score

 root1="D:/Anaconda3-5.0.1-Windows-x86_64/anaconda/work/shuili2/data.csv"

 #root2="./id="+str(id_num)+"_process_data.csv"

 dataset = read_csv(root1) #数据转化为数组

 dataset=dataset.values

 # load dataset

 dataframe = pd.read_csv("data.csv", header=None)

 dataset = dataframe.values

 X = dataset[:, 0:29].astype(float)

 Y = dataset[:, 29:]

 # encode class values as integers

 #encoder = LabelEncoder()

 #encoded_Y = encoder.fit_transform(Y)

 # convert integers to dummy variables (one hot encoding)

 #dummy_y = np_utils.to_categorical(encoded_Y)

 # define model structure

 def baseline_model():

     model = Sequential()

     model.add(Dense(output_dim=10, input_dim=29, activation='relu'))

     model.add(Dropout(0.2))

     model.add(Dense(output_dim=8, input_dim=10, activation='softmax'))

     # Compile model

     model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

     return model

 estimator = KerasClassifier(build_fn=baseline_model, nb_epoch=200, batch_size=50)

 # splitting data into training set and test set. If random_state is set to an integer, the split datasets are fixed.

 X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.01, random_state=0)

 estimator.fit(X_train, Y_train)

 # make predictions

 pred = estimator.predict(X_test)

 # inverse numeric variables to initial categorical labels

 #init_lables = encoder.inverse_transform(pred)

 # k-fold cross-validate

 seed = 42

 np.random.seed(seed)

 kfold = KFold(n_splits=10, shuffle=True, random_state=seed)

 results = cross_val_score(estimator, X, Y, cv=kfold)

 '''

from pandas import read_csv

root1="F:/goverment/shuili2/techproblem_text_train.csv"

root2="F:/goverment/shuili2/techproblem_text_test.csv"

root3="F:/goverment/shuili2/text_train_4problem.csv"

root4="F:/goverment/shuili2/text_test_4problem.csv"

'''大类小类一起预测'''

#root2="./id="+str(id_num)+"_process_data.csv"

dataset1 = read_csv(root1) #数据转化为数组

dataset1=dataset1.values

dataset2 = read_csv(root2) #数据转化为数组

dataset2=dataset2.values

X_train=dataset1[:,:28]

Y_train=dataset1[:,28:]

X_test=dataset2[:,:28]

Y_test=dataset2[:,28:]

from pprint import pprint

pprint(dataset1)

#＃使用二进制相关性

#scikit-multilearn

from skmultilearn.problem_transform import BinaryRelevance

from sklearn.naive_bayes import GaussianNB

#initialize二进制相关多标签分类器

#用高斯朴素贝叶斯基分类器

classifier = BinaryRelevance(GaussianNB())

 #训练

classifier.fit(X_train, Y_train)

 #预测

predictions = classifier.predict(X_test)

#计算精度用

from sklearn.metrics import accuracy_score

accuracy_score(Y_test,predictions)

python多标签分类模版的更多相关文章

Python-HTML 最强标签分类
编程: 使用(展示)数据存储数据处理数据前端 1. 前端是做什么的? 2. 我们为什么要学前端? 3. 前端都有哪些内容? 1. HTML 2. CSS 3. JavaScript 4.jQue ...
前端入门html（常用标签及标签分类）
day47 参考:https://www.cnblogs.com/liwenzhou/p/7988087.html 任何标签都有有三个属性:ID,class.style <!DOCTYPE ht ...
使用MXNet远程编写卷积神经网络用于多标签分类
最近试试深度学习能做点什么事情.MXNet是一个与Tensorflow类似的开源深度学习框架,在GPU显存利用率上效率高,比起Tensorflow显著节约显存,并且天生支持分布式深度学习,单机多卡.多 ...
LM-MLC 一种基于完型填空的多标签分类算法
LM-MLC 一种基于完型填空的多标签分类算法 1 前言本文主要介绍本人在全球人工智能技术创新大赛[赛道一]设计的一种基于完型填空(模板)的多标签分类算法:LM-MLC,该算法拟合能力很强能感知标签 ...
scikit-learn一般实例之八:多标签分类
本例模拟一个多标签文档分类问题.数据集基于下面的处理随机生成: 选取标签的数目:泊松(n~Poisson,n_labels) n次,选取类别C:多项式(c~Multinomial,theta) 选取文 ...
CSS.02 -- 样式表及标签分类（块、行、行内块元素）、CSS三大特性、背景属性
样式表书写位置内嵌式写法 <head> <style type="text/css"> 样式表写法 </style> </head&g ...
html(常用标签,标签分类)，页面模板， CSS(css的三种引入方式)，三种引入方式优先级
HTML 标记语言为非编程语言负责完成页面的结构组成: 标签:被<>包裹的由字母开头,可以结合合法字符( -|数字 ),能被浏览器解析的特殊符号,标签有头有尾指令:被<>包 ...
前端 HTML 标签分类
三种: 1.块级标签: 独占一行,可设置宽度,高度.如果设置了宽度和高度,则就是当前的宽高.如果宽度和高度没有设置,宽度是父盒子的宽度,高度根据内容填充. 2.行内标签:在一行内显示,不能设置宽度,高 ...
htm基础知识，css的链入以及标签分类。
<!DocTYPE> DOC--Document 文档 TYPE 类型文档类型告诉浏览器这是什么文件单标签: meta 设置 charset 设置编码双标签: 开始 ...

随机推荐

VS2005 使用体验
鄙人记性真心不好,看了就忘.此文记录下日常小工具的tips. 1)VS的小番茄: 破解版 Visual.Assist.X.V10.6.1833支持VS2010 VS2008 VS2005 VC6 破解 ...
Python中的数据结构 --- 集合（set)
1.集合(set)里面的元素是不可以重复的 s={1,2,3,3,4,3,4} ## 输出之后,没有重复的 2.定义一个空集合 s = set([]) print s,type(s)3 ...
我的第一个React自定义组件
今天随便翻了一下antd的组件库,看到下面这样的组件,当时我就震惊了: 这尼玛,这是出于什么样的考虑,一个列表还要用户编写子项的渲染方式. 所以,我就自己写了一个 List.js: List.less ...
Amazon面试题
亚马逊面试题: 如下所示的Map中,0代表海水,1代表岛屿,其中每一个岛屿与其八领域的区间的小岛能相连组成岛屿群.写代码,统计Map中岛屿个数. /* Q1. Map [ 0 0 0 0 0 0 0 ...
Iphone 消息通知(APNS)的3种方式 -- C# 和 nodejs
发送 APNS 使用 p12 文件(C#) public static bool PushWithP12(string apnToken, string message) { _log.DebugFo ...
Java基础部分全套教程.
这是我自己早前听课时整理的java基础全套知识,使用于初学者,也可以适用于中级的程序员,我做成了chm文档的类型,你们可以下载笔记是比较系统全面,可以抵得上市场上90%的学习资料.讨厌那些随便乱写的 ...
【剑指offer】04A二维数组中的查找，C++实现
1.题目在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数数组和一个整数,判断数组中是否含有该整数. 2.思路首先选取数 ...
【Python爬虫学习笔记（1）】urllib2库相关知识点总结
1. urllib2的opener和handler概念 1.1 Openers: 当你获取一个URL你使用一个opener(一个urllib2.OpenerDirector的实例).正常情况下,我们使 ...
BZOJ5142: [Usaco2017 Dec]Haybale Feast（双指针&set）（可线段树优化）
5142: [Usaco2017 Dec]Haybale Feast Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 182 Solved: 131[ ...
HihoCoder 1075 开锁魔法III（概率DP+组合）
描述一日,崔克茜来到小马镇表演魔法. 其中有一个节目是开锁咒:舞台上有 n 个盒子,每个盒子中有一把钥匙,对于每个盒子而言有且仅有一把钥匙能打开它.初始时,崔克茜将会随机地选择 k 个盒子用魔法将它 ...

python多标签分类模版

python多标签分类模版的更多相关文章

随机推荐

热门专题