pytorch kaggle 泰坦尼克生存预测

也不知道对不对，就凭着自己的思路写了一个

数据集：https://www.kaggle.com/c/titanic/data

 import torch

 import torch.nn as nn

 import pandas as pd

 import numpy as np

 class DataProcessing(object):

     def __init__(self):

         pass

     def get_data(self):

         data_train = pd.read_csv('train.csv')

         label = data_train[['Survived']]

         data_test = pd.read_csv('test.csv')

         # 读取指定列

         gender = pd.read_csv('gender_submission.csv', usecols=[1])

         return data_train, label, data_test, gender

     def data_processing(self, data_):

         # 训练集测试集都进行相同的处理

         data = data_[['Pclass', 'Sex', 'Age', 'SibSp', 'Fare', 'Cabin', 'Embarked']]

         data['Age'] = data['Age'].fillna(data['Age'].mean())

         data['Cabin'] = pd.factorize(data.Cabin)[0]

         data.fillna(0, inplace=True)

         data['Sex'] = [1 if x == 'male' else 0 for x in data.Sex]

         data['p1'] = np.array(data['Pclass'] == 1).astype(np.int32)

         data['p2'] = np.array(data['Pclass'] == 2).astype(np.int32)

         data['p3'] = np.array(data['Pclass'] == 3).astype(np.int32)

         data['e1'] = np.array(data['Embarked'] == 'S').astype(np.int32)

         data['e2'] = np.array(data['Embarked'] == 'C').astype(np.int32)

         data['e3'] = np.array(data['Embarked'] == 'Q').astype(np.int32)

         del data['Pclass']

         del data['Embarked']

         return data

     def data(self):

         # 读数据

         train_data, label, test_data, gender = self.get_data()

         # 处理数据

         # 训练集输入数据

         train = np.array(data_processing.data_processing(train_data))

         # 训练集标签

         train_label = np.array(label)

         # 测试集

         test = np.array(data_processing.data_processing(test_data))

         # 测试集标签

         test_label = np.array(gender)

         train = torch.from_numpy(train).float()

         train_label = torch.tensor(train_label).float()

         test = torch.tensor(test).float()

         test_label = torch.tensor(test_label)

         return train, train_label, test, test_label

 class MyNet(nn.Module):

     def __init__(self):

         super(MyNet, self).__init__()

         self.fc = nn.Sequential(

             nn.Linear(11, 7),

             nn.Sigmoid(),

             nn.Linear(7, 7),

             nn.Sigmoid(),

             nn.Linear(7, 1),

         )

         self.opt = torch.optim.Adam(params=self.parameters(), lr=0.001)

         self.mls = nn.MSELoss()

     def forward(self, inputs):

         # 前向传播

         return self.fc(inputs)

     def train(self, inputs, y):

         # 训练

         out = self.forward(inputs)

         loss = self.mls(out, y)

         self.opt.zero_grad()

         loss.backward()

         self.opt.step()

         # print(loss)

     def test(self, x, y):

         # 测试

         # 将variable张量转为numpy

         # out = self.fc(x).data.numpy()

         count = 0

         out = self.fc(x)

         sum = len(y)

         for i, j in zip(out, y):

             i = i.detach().numpy()

             j = j.detach().numpy()

             loss = abs((i - j)[0])

             if loss < 0.3:

                 count += 1

         # 误差0.3内的正确率

         print(count/sum)

 if __name__ == '__main__':

     data_processing = DataProcessing()

     train_data, train_label, test_data, test_label = data_processing.data()

     net = MyNet()

     count = 0

     for i in range(20000):

         # 为了减小电脑压力,分批训练 100个训练一次  ## 2018.12.22补充：正确的做法应该是用batch

         for n in range(len(train_data)//100 + 1):

             batch_data = train_data[n*100: n*100 + 100]

             batch_label = train_label[n*100: n*100 + 100]

             net.train(train_data, train_label)

     net.test(test_data, test_label)  # 输出结果：0.7488038277511961

效果一般吧，不过至少出来了，hiahiahia

pytorch kaggle 泰坦尼克生存预测的更多相关文章

利用python进行泰坦尼克生存预测——数据探索分析
最近一直断断续续的做这个泰坦尼克生存预测模型的练习,这个kaggle的竞赛题,网上有很多人都分享过,而且都很成熟,也有些写的非常详细,我主要是在牛人们的基础上,按照数据挖掘流程梳理思路,然后通过练习每 ...
Kaggle初体验之泰坦尼特生存预测
Kaggle初体验之泰坦尼特生存预测学习完了决策树的ID3.C4.5.CART算法,找一个试手的地方,Kaggle的练习赛泰坦尼特很不错,记录下流程首先注册一个账号,然后在顶部菜单栏Co ...
Kaggle 泰坦尼克
入门kaggle,开始机器学习应用之旅. 参看一些入门的博客,感觉pandas,sklearn需要熟练掌握,同时也学到了一些很有用的tricks,包括数据分析和机器学习的知识点.下面记录一些有趣的数据 ...
Kaggle泰坦尼克数据科学解决方案
原文地址如下: https://www.kaggle.com/startupsci/titanic-data-science-solutions --------------------------- ...
逻辑回归应用之Kaggle泰坦尼克之灾(转）
正文:14pt 代码:15px 1 初探数据先看看我们的数据,长什么样吧.在Data下我们train.csv和test.csv两个文件,分别存着官方给的训练和测试数据. import pandas ...
Spark学习笔记——泰坦尼克生还预测
package kaggle import org.apache.spark.SparkContext import org.apache.spark.SparkConf import org.apa ...
python__画图表可参考(转自：寒小阳逻辑回归应用之Kaggle泰坦尼克之灾)
出处:http://blog.csdn.net/han_xiaoyang/article/details/49797143 2.背景 2.1 关于Kaggle 我是Kaggle地址,翻我牌子亲,逼格 ...
Kaggle泰坦尼克-Python（建模完整流程，小白学习用）
参考Kernels里面评论较高的一篇文章,整理作者解决整个问题的过程,梳理该篇是用以了解到整个完整的建模过程,如何思考问题,处理问题,过程中又为何下那样或者这样的结论等! 最后得分并不是特别高,只是到 ...
Kaggle_泰坦尼克乘客存活预测
转载逻辑回归应用之Kaggle泰坦尼克之灾此转载只为保存!!! ————————————————版权声明:本文为CSDN博主「寒小阳」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附 ...

随机推荐

CPU-bound(计算密集型) 和I/O bound(I/O密集型)
概念概念I/O系统,英文全称为“Input output system”,中文全称为“输入输出系统”,由输入输出控制系统和外围设备两部分组成,是计算机系统的重要组成部分.在计算机系统中,通常把处理器 ...
nginx之快速查找配置文件
nginx的配置放在nginx.conf文件中,一般我们可以使用以下命令查看服务器中存在的nginx.conf文件. locate nginx.conf /usr/local/nginx/conf ...
oracle小记：dba_data_files
今天给表空间扩展的时候,使用了dba_data_files进行查询.查阅了网上的资料. 该系统系统中含有以下字段每个字段的含义如下:
day 7-9 IO模型
一,同步和异步,阻塞和非阻塞同步(synchronous):一个进程在执行某个任务时,另外一个进程必须等待其执行完毕,才能继续执行 #所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就 ...
Python创建virtualenv（虚拟环境）方法
本文目录一前言二通过virtualenv软件创建三在pycharm下创建新建项目四已有项目使用和创建虚拟环境五参数说明一前言需求: --公司之有一台服务器 ...
python爬虫之PyQuery的基本使用
PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery 是 Python 仿照 jQuery 的严 ...
如何通过stat获取目录或文件的权限的数字形式
man stat 查看帮助. -c --format=FORMAT use the specified FORMAT instead of the default; output a new line ...
sql 用户相关命令
查看所有用户 select distinct concat(user, '@', host,';') as userList from mysql.user; select #查找 distinct ...
WinForm中在非UI线程更改控件值的办法
从非UI线程调用UI控件赋值.或进行其他更新UI的操作的话,会出现异常: System.InvalidOperationException:“线程间操作无效: 从不是创建控件“xxx”的线程访问它.” ...
在Linq to sql 和 Entity framework 中使用lambda表达式实现left join
在Linq to sql 和 Entity framework 中使用lambda表达式实现left join 我们知道lambda表达式在Linq to sql 和 Entity framework ...

pytorch kaggle 泰坦尼克生存预测

pytorch kaggle 泰坦尼克生存预测的更多相关文章

随机推荐

热门专题