遇到的坑:

  1. 做多分类,用CrossEntropyLoss时,训练时候的正确标签的范围应该是[0,n-1],而不是[1,n],不然会报 IndexError: Target is out of bounds

    比如这题就应该预处理为[0,8],而不是[1,9]
  2. pd.read_csv以后得到data,然后np.array(data)里面就已经不包括原本csv文件里第一行的名称了
  3. 关于read_csv用相对路径读不到,用绝对路径就读的到的问题,应该是vscode workspace的问题,在vscode里打开文件即可

疑问:

读进来的数据数据都要变成np.float32形式?

import torch
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
from torch.utils.data import Dataset
import torch.nn.functional as F
import torch.optim as optim
import numpy as np
import pandas as pd batch_size=64
#归一化 均值和方差?
transform=transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,),(0.3081,))]) def process_label(labels):
ret=[]
for label in labels:
ret.append(int(label[-1])-1)
ret=torch.tensor(ret)
return ret class otto(Dataset):
def __init__(self,filepath):
data=pd.read_csv(filepath)
#print(data)
labels=data['target'] self.len=data.shape[0]
self.x_data=torch.tensor(np.array(data)[:,1:-1].astype(np.float32))
self.y_data=process_label(labels) def __getitem__(self,index):
return self.x_data[index],self.y_data[index] def __len__(self):
return self.len # train_dataset=datasets.MNIST(root='./dataset/mnist/',train=True,download=True,transform=transform)
# train_loader=DataLoader(train_dataset,shuffle=True,batch_size=batch_size)
# test_dataset=datasets.MNIST(root='./dataset/mnist/',train=False,download=True,transform=transform)
# test_loader=DataLoader(test_dataset,shuffle=False,batch_size=batch_size) dataset=otto('/Users/zzy81/Desktop/py/62/9/train.csv')
train_loader=DataLoader(dataset=dataset,batch_size=64,shuffle=True,num_workers=0) class Net(torch.nn.Module):
def __init__(self):
super(Net,self).__init__()
self.l1=torch.nn.Linear(93,70)
self.l2=torch.nn.Linear(70,60)
self.l3=torch.nn.Linear(60,40)
self.l4=torch.nn.Linear(40,20)
self.l5=torch.nn.Linear(20,9) def forward(self,x):
# x=x.view(-1,93)
x=F.relu(self.l1(x))
x=F.relu(self.l2(x))
x=F.relu(self.l3(x))
x=F.relu(self.l4(x))
return self.l5(x) def solve(self,x):
with torch.no_grad():
x=F.relu(self.l1(x))
x=F.relu(self.l2(x))
x=F.relu(self.l3(x))
x=F.relu(self.l4(x))
x=self.l5(x)
# x=F.relu(self.l5(x)) #need to be changed to softmax
_,tmp=torch.max(x,dim=1)
tmp=pd.get_dummies(tmp)
return tmp model=Net() criterion=torch.nn.CrossEntropyLoss()
optimizer=optim.SGD(model.parameters(),lr=0.01,momentum=0.5) def train(epoch): running_loss=0.0
for batch_idx,data in enumerate(train_loader):
inputs,target=data
optimizer.zero_grad()
outputs=model(inputs)
loss=criterion(outputs,target)
#这里outputs.shape=(64,9), target.shape=(64)
loss.backward()
optimizer.step() running_loss+=loss.item()
if batch_idx%300==299:
print('[%d, %5d] loss:%.3f'%(epoch+1,batch_idx+1,running_loss/300))
running_loss=0.0 # def test():
# correct=0
# total=0
# with torch.no_grad():
# for data in test_loader:
# images,labels=data
# outputs=model(images)
# _,predicted=torch.max(outputs.data,dim=1)
# total+=labels.size(0)
# correct+=(predicted==labels).sum().item()
# print('accuracy on test set : %d %%' % (100*correct/total)) if __name__=='__main__':
for epoch in range(3000):
train(epoch)
test_data=pd.read_csv('./test.csv')
test_input=torch.tensor(np.array(test_data)[:,1:].astype(np.float32))
output=model.solve(test_input)
output.columns=['Class_1','Class_2','Class_3','Class_4','Class_5','Class_6','Class_7','Class_8','Class_9']
output.insert(0,'id',test_data['id'])
tmp=pd.DataFrame(output)
tmp.to_csv('./zzy_predict.csv',index=False)
# test()

Otto Group Product Classification的更多相关文章

  1. Otto Product Classification Winner's Interview: 2nd place, Alexander Guschin ¯\_(ツ)_/¯

    Otto Product Classification Winner's Interview: 2nd place, Alexander Guschin ¯\_(ツ)_/¯ The Otto Grou ...

  2. (原创)(四)机器学习笔记之Scikit Learn的Logistic回归初探

    目录 5.3 使用LogisticRegressionCV进行正则化的 Logistic Regression 参数调优 一.Scikit Learn中有关logistics回归函数的介绍 1. 交叉 ...

  3. PyTorch深度学习实践——多分类问题

    多分类问题 目录 多分类问题 Softmax 在Minist数据集上实现多分类问题 作业 课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩 ...

  4. How Much Did It Rain? Winner's Interview: 1st place, Devin Anzelmo

    How Much Did It Rain? Winner's Interview: 1st place, Devin Anzelmo An early insight into the importa ...

  5. [机器学习]集成学习--bagging、boosting、stacking

    集成学习简介 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务. 如何产生"好而不同"的个体学习器,是集成学习研究的核心. 集成学习的思路是通过 ...

  6. SAP T CODE : Description (Program)

    SAP T CODE : Description (Program) V : Quickstart RKCOWUSL (RKCOWUSL)V+01 : Create Sales Call (SAPMV ...

  7. Entity Framework 基于方法的查询语法

      实体框架(Entity Framework )是 ADO.NET 中的一套支持开发面向数据的软件应用程序的技术. LINQ to Entities 提供语言集成查询 (LINQ) 支持,它允许开发 ...

  8. LINQ to Entities 查询语法

    转自: http://www.cnblogs.com/asingna/archive/2013/01/28/2879595.html 实体框架(Entity Framework )是 ADO.NET  ...

  9. Magento创建configurable产品的要点

    接着上一篇用API创建可配置的产品Configurable Product说事.Magento的产品类型可分为Simple Product.Group Product.Configurable Pro ...

  10. LINQ(隐式表达式、lambda 表达式)

    .NET 中一项突破性的创新是 LINQ(Language Integrated Query,语言集成查询),这组语言扩展让你能够不必离开舒适的 C# 语言执行查询. LINQ 定义了用于构建查询表达 ...

随机推荐

  1. oracle WMSYS.WM_CONCAT 函数使用

    1.用法 WMSYS.WM_CONCAT(要连接的字段) 该函数返回来自同一个分组的指定字段的非NULL值的连接起来字符串,默认逗号连接,一般搭配分组函数使用 2.示例 select XFJ_ID,R ...

  2. JVMCFRE003 bad major version问题

    项目启动异常日志 [21-11-18 23:46:58:166 CST] 00000020 DispatcherSer I org.springframework.web.servlet.Framew ...

  3. SpringBoot导读

    SpringBoot 一.导读 1.开发工具及技术栈 JDK:jdk1.8.0_191 开发工具:IntelliJIDEA 2020.3.2 SpringBoot: 简化Spring的开发 需要一定的 ...

  4. java的知识点

    java 知识点 1.包装类自带有parse方法 Integer i = 315; int i1 = Integer.parseInt("315"); System.out.pri ...

  5. Java 18-方法 认识方法与方法定义

    1.认识方法 1)什么是方法 Java方法是语句的集合,它们在一起执行一个功能; 方法是解决一类问题的步骤的有序组合; 方法一般包含于类中; 方法在程序中被创建,在其他地方被引用2 2)方法的有点 使 ...

  6. 记录坑:Chrome谷歌浏览器最小化和页面遮挡后JS代码不稳定

    问题:用定时器 setInterval()做个滚动通知的动画,浏览器最小化时,定时器 setInterval()失效了,导致滚动条重叠了 可能原因: js代码不稳定 Chrome谷歌浏览器最小化和页面 ...

  7. 92、kkfile打印当前页

    使用kkfile预览pdf时,有肯能需要打印其中的某一张.如果pdf中有几百张,那么打印加载就会很慢.打印当前页就不会出现这个问题. 这个是我编译后的,有需要的请联系QQ: 1842988062

  8. fabric2.2学习笔记1

    fabric2.2学习笔记1 20201303张奕博 2023年1月9日 hyperledger fabric 结构分析 每个Server作用: AdminServer:控制该节点的命运,可以删除该节 ...

  9. v4l2编程

    一.video 4 linux 2 ,是linux中关于视频设备的内核驱动.在linux中,视频设备是设备文件,可以像访问普通文件一样对其进行读写,摄像头在/dev/video 0下 二一般操作流程( ...

  10. antd timePicker组件限制当前之前的时间不可选择

    import React from 'react'; import ReactDOM from 'react-dom'; import {Input,DatePicker,Form,Col,Butto ...