西瓜书3.4 解题报告（python 多分类学习十折交叉法）

偷懒找了UCI上最小的一个数据集，数据大约是集装箱起重机的转动速度、角度，判断其力量大小（我不懂起重机啊啊啊）

虽然不懂但并不妨碍写代码分类，显然标记就是力量，分为0.3、0.5、0.7三种。具体的模型学习还是使用对率回归，那么数据集如下。

x=np.array([[1,2,6,7,10,8,3,1,6,7,8,9,9,2,6],[-5,5,-2,2,-2,2,-2,2,-5,5,-5,5,0,0,0],[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]])

y=np.array([0.3,0.3,0.3,0.3,0.3,0.3,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.7,0.7])

因为是多分类问题所以我们要建立多个分类器，这次使用OvR的方法，建立三个分类器也就是要计算出三组参数的值：

b=np.array([[0],[0],[1]])

b1=np.array([[0],[0],[1]])

b2=np.array([[0],[0],[1]])

b3=np.array([[0],[0],[1]])

b是用于计算的时候暂存参数。既然是十折交叉法，那我们每次就取两个样本作为测试集，为了方便计算，每次的训练集我们赋值到另外两个矩阵上，先在全局初始化它们：

x1=np.zeros(shape=(3,13))

y1=np.arange(0,13)

注意这里的y1不能用zeros初始化，否则编译器认为这个y1的shape是（0,13）,会报错，非常要命（躺）。

求参数的主体函数基本不用动，稍微改下参数名以防重复即可：

def fd():

     b11 = 0

     for i in range(13):

          k=np.exp(np.dot(b.T,np.array([x1[:,i]]).T))

          b11=b11-np.array([x1[:,i]])*( y1[i]-(k/(1+k)))

     return b11

def sd():

     b22 = 0

     for i in range(13):

          k = np.exp(np.dot(b.T,np.array([x1[:,i]]).T))

          b22=b22+np.dot(np.array([x1[:,i]]).T,np.array([x1[:,i]])) * (k/(1+k)) * (1-(k/(1+k)))

     return b22

def form():

    mae=0

    ima=0

    b = np.array([[0], [0], [1]])

    while(1):

         ima=0

         for i in range(13):

              k=np.dot(b.T,np.array([x1[:,i]]).T)

              ima=ima+(-y1[i]*k+np.log(1+np.exp(k)))

         if(np.abs(ima-mae)<=0.0001):

              break

         mae=ima

         b11=fd()

         b22=sd()

         b=b-np.dot(linalg.inv(b22),b11.T)

    return b

然后每次OvR我们要对y1进行重新赋值，将值按要求修改为1和0：

def sety(tru):

     for k in range(13):

          if (y1[k] == tru):

               y1[k] = 1

          else:

               y1[k] = 0

     return

tru就是该分类器应当分类为真值的y的原值。

而后为了判断每个分类器的正确率，需要另写一个函数，这里写的这个函数只判断对于单个样本（在全集中的序列号为i）的正误，显然的，

只要应当判断其为1的分类器出错就可以直接确定其出错，虽然这种操作还是有一定风险的（如果其他分类器也判断该例为正该怎么算），

但偷懒就这么写了。

def judg(i):

     s0=0.0

     if (y[i] == 0.3):

          z = np.exp(np.dot(b1.T, np.array([x[:, i]]).T))

     elif (y[i] == 0.5):

          z = np.exp(np.dot(b2.T, np.array([x[:, i]]).T))

     else:

          z = np.exp(np.dot(b3.T, np.array([x[:, i]]).T))

     if (z > 0):

          z=1

     else:

          z=0

     return z

然后就是每次抽取训练集的函数，也就是从x、y中删掉指定两列之后赋值给x1、y1的函数：

def delex(i,j):

     k=0

     for f in range(15):

          if(f!=i and f!=j):

               x1[:,k]=x[:,f]

               k=k+1

     return

def deley(i,j):

     k = 0

     for f in range(y.size):

          if (f != i and f != j):

                y1[k] = y[f]

                k = k + 1

     return

主函数如下：

s=0.0

for i in range(15):

     for j in range(i+1,15):

          s0=0.0

          delex(i,j)

          deley(i,j)

          sety(0.3)

          b1=form()

          deley(i,j)

          sety(0.5)

          b2=form()

          deley(i,j)

          sety(0.7)

          b3=form()

          s=s+(judg(i)+judg(j))/2

          print('第',i,'个与第',j,'个作为测试集时的正确率暂时总和为',s)

s=s/105

print('正确率为：',s)

运行结果：

第 0 个与第 1 个作为测试集时的正确率暂时总和为 1.0...(略)

第 13 个与第 14 个作为测试集时的正确率暂时总和为 105.0

正确率为： 1.0

留一法同理，修改一下参数数量和一些数字就行，编译器作怪的话可以加一些跳出条件。

补充另一个数据集的读取文件然后进行计算的代码，虽然没有error但是跑了一顿午饭也没跑出什么结果，卡无限循环了，改了个条件终于跑出结果，姑且摆在这里看看。

import numpy as np

from numpy import linalg

import math

import scipy

x=np.ones(shape=(14,178))

y=np.arange(0,178)

x1=np.ones(shape=(14,176))

y1=np.arange(0,176)

b=np.array([[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[1]])

b1=np.array([[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[1]])

b2=np.array([[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[1]])

b3=np.array([[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[1]])

def readdata():

    k=0

    file=open('C:\\Users\\33298\\Desktop\\data\\2\\winedata.txt','r')

    for line in file.readlines():

        clas,alcohol,malic,ash,alcalin,magne,t_phenols,flava,nonfla,proantho,color,hue,od,proli=line.split(',')

        #print(clas,alcohol,malic,ash,alcalin,magne,t_phenols,flava,nonfla,proantho,color,hue,od,proli)

        x[:,k]=np.array([alcohol,malic,ash,alcalin,magne,t_phenols,flava,nonfla,proantho,color,hue,od,proli,1]).T

        y[k]=clas

        k=k+1

    return

def fd():

    b11 = 0

    for i in range(176):

        k = np.exp(np.dot(b.T, np.array([x1[:, i]]).T))

        b11 = b11 - np.array([x1[:, i]]) * (y1[i] - (k / (1 + k)))

    return b11

def sd():

    b22 = 0

    for i in range(176):

        k = np.exp(np.dot(b.T, np.array([x1[:, i]]).T))

        b22 = b22 + np.dot(np.array([x1[:, i]]).T, np.array([x1[:, i]])) * (k / (1 + k)) * (1 - (k / (1 + k)))

    return b22

def form():

    mae = 0

    ima = 0

    b=np.array([[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[0],[1]]) 
    num=10

    while (num):

        ima = 0

        for i in range(176):

            k = np.dot(b.T, np.array([x1[:, i]]).T)

            if(k>1):

                ima=ima+np.log(1+np.exp(-k))

            else:

                ima = ima + (-y1[i] * k + np.log(1 + np.exp(k)))

        if (np.abs(ima - mae) <= 0.000001):

            break

        mae = ima

        b11 = fd()

        b22 = sd()

        b = b - np.dot(linalg.inv(b22), b11.T)
        num-=1

    return b

def sety(tru):

    for k in range(13):

        if (y1[k] == tru):

            y1[k] = 1

        else:

            y1[k] = 0

    return

def judg(i):

    s0 = 0.0

    if (y[i] == 1):

        z = np.exp(np.dot(b1.T, np.array([x[:, i]]).T))

    elif (y[i] == 2):

        z = np.exp(np.dot(b2.T, np.array([x[:, i]]).T))

    else:

        z = np.exp(np.dot(b3.T, np.array([x[:, i]]).T))

    if (z > 0):

        z = 1

    else:

        z = 0

    return z

def delex(i, j):

    k = 0

    for f in range(178):

        if (f != i and f != j):

            x1[:, k] = x[:, f]

            k = k + 1

    return

def deley(i, j):

    k = 0

    for f in range(y.size):

        if (f != i and f != j):

            y1[k] = y[f]

            k = k + 1

    return

readdata()

s = 0.0

for i in range(178):

    for j in range(i + 1, 178):

        s0 = 0.0

        delex(i, j)

        deley(i, j)

        sety(1)

        b1 = form()

        deley(i, j)

        sety(2)

        b2 = form()

        deley(i, j)

        sety(3)

        b3 = form()

        s = s + (judg(i) + judg(j)) / 2

        print('第', i, '个与第', j, '个作为测试集时的正确率暂时总和为', s)

s = s / 15753

print('正确率为：', s)

西瓜书3.4 解题报告（python 多分类学习十折交叉法）的更多相关文章

【LeetCode】面试题62. 圆圈中最后剩下的数字解题报告(Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法约瑟夫环日期题目地址:https://leetco ...
【LeetCode】107. Binary Tree Level Order Traversal II 解题报告 (Python&C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法方法一:DFS 方法二:迭代日期 [LeetCode ...
【LeetCode】206. Reverse Linked List 解题报告(Python&C++&java)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法迭代递归日期 [LeetCode] 题目地址:h ...
【LeetCode】26. Remove Duplicates from Sorted Array 解题报告(Python&C++&Java)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法双指针日期 [LeetCode] https:// ...
【LeetCode】1019. Next Greater Node In Linked List 解题报告 (Python&C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法单调递减栈日期题目地址:https://leetc ...
【剑指Offer】05. 替换空格解题报告 (Python & C++ & Java)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 个人微信公众号:负雪明烛目录题目描述解题方法方法一:新建可变长度的容器方法二:原 ...
【LeetCode】94. Binary Tree Inorder Traversal 解题报告(Python&C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述解题方法递归迭代日期题目地址:https://leetcode.c ...
【LeetCode】654. Maximum Binary Tree 解题报告 (Python&C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法递归日期题目地址:https://leetcode ...
【LeetCode】784. Letter Case Permutation 解题报告 (Python&C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法回溯法循环日期题目地址:https://leet ...
【LeetCode】341. Flatten Nested List Iterator 解题报告(Python&C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法递归+队列栈日期题目地址:https://lee ...

随机推荐

Day25:报告编写等
今天完成的任务: 1.完成全部结论的编写,完成一部分界面测试的撰写. 2.完成moodle配置明日计划: 1.完成前端的原型介绍 2.完善前端设计与实现报告每日小结: 今天完成了最后一次的答辩, ...
ES6-Class类下
前面super的源码: 查看代码 <script> // 1.作为函数调用 // 代表父类的构造方法,只能用在子类的构造方法中,用在其他地方就会报错 // super 虽然代表了父类的构造 ...
Influxdb客户端使用
Influxdb客户端使用 1. 简介 Influxdb在网络上可以搜索到一个叫InfluxdbStudio的工具,但只能在window下使用,有时在其他系统下做简单数据查询时就比较麻烦,下面以Inf ...
Redis 实战（一）AOF 持久化配置和数据恢复
真枪实弹:AOF 持久化配置和数据恢复大家好,我是悟空呀. 如果你曾经背过 RDB 和 AOF 的面试八股文,那么对 AOF 肯定不陌生,但如果只停留在应付面试阶段,对于提高自己的技术是远远不够的, ...
Razor视图cshtml做到运行时编译【提高开发效率】
当你的.NET开发工具升级到.NET Core版本以上,就会发现有时候无法将视图界面做的修改可以直接保存后刷新输出,一般都需要重新热重载或重新编译,这样会导致开发效率过慢的行为,开发者无法直接直观地看 ...
matlab判断操作
类型判断 1.查看变量类型时可用class,判断某变量的类型值:会生成0或1,1-匹配,0-不匹配 isa(Data,'double') isa(Data,'cell') 2.也可用如下. strcm ...
模型admin 外键的相关操作
....@admin.register(MyModel)class MyModelAdmin(admin.ModelAdmin): def method(self, request, queryset ...
js——带暂停、启动功能的定时
简单的封装,将 interval 二次封装,对外提供暂停.启动功能. 不足之处:interval定时间隔是固定的,在调用异步函数的时候,可能会出现bug.例如:在调用ajax异步请求过程中,发送a.b ...
初识Node
Node的定义:一个搭建在Chrome JavaScript运行时上的平台,用于构建高速.可伸缩的网络程序. Node构建与JS之上,在服务器端,Node使用V8虚拟机,执行的是本地机器码,省去了 ...
ESP32-IDF 在vscode环境搭建
前言由于许多的未知原因,我尝试过许多网上教程,在vscode上搭建ESP-IDF环境,但结果是耗费了大把时间,结果还非常不理想. 在参考了(一)esp32开发环境搭建(VSCode+IDF实现单步调 ...

西瓜书3.4 解题报告（python 多分类学习 十折交叉法）

西瓜书3.4 解题报告（python 多分类学习 十折交叉法）的更多相关文章

随机推荐

热门专题

西瓜书3.4 解题报告（python 多分类学习十折交叉法）

西瓜书3.4 解题报告（python 多分类学习十折交叉法）的更多相关文章