kaggle gradient

kaggle gradient_descent

1.描述

自写梯度下降

2.代码

import numpy as np

import matplotlib.pyplot as plt

# train_X = np.array([[1,2,3,4,5,6,7,8,9,10],[1,2,3,4,5,6,7,8,9,10]]).T

# train_y = np.array([2,4,6,8,10,12,14,16,18,20]).T

# test_X = np.array([[2,4,12,11],[3,6,3,9]]).T # 5 10 15 20

train_X = np.random.randn(1000,10)

train_y = np.random.randn(1000,1)

test_X =  np.random.randn(1000,10)

step_len = 0.1

max_iterations = 100000

epsilon = 1e-7

def ComputeCost(X,y,theta):

    tmp = X.dot(theta)-y.reshape(y.shape[0],1)

    return 1/(2*len(y))*sum((tmp*tmp))

def GradientDescent(X,y,step_len,max_iterations):

    X = np.array(X)

    y = np.array(y)

    X = np.column_stack( (np.ones((len(y),1)),X))

    theta = np.zeros((X.shape[1],1))

    m = len(y)

    J_his = []

    for i in range(0,max_iterations):

        tmp = X.dot(theta)-y.reshape(y.shape[0],1)

        theta = theta - step_len / m * X.T.dot(tmp)

        J_his.append(ComputeCost(X,y,theta))

        #print(J_his[-1])

        if(len(J_his)>=2 and J_his[-2] - J_his[-1] >= 0 and J_his[-2] - J_his[-1] <= epsilon):

            print('已收敛')

            break

        if(len(J_his)>=2 and J_his[-1] - J_his[-2] >= 0):

            print('步长过大')

            break

    return theta,J_his

def Predict(X,theta):

    one = np.ones((X.shape[0],1))

    X = np.column_stack(( one,X ))

    return X.dot(theta)

def Normalizetion(x):

    sum_tmp = np.sum(x,axis=0)

    max_tmp = np.max(x,axis=0)

    min_tmp = np.min(x,axis=0)

    ave_tmp = np.average(x,axis=0)

    return (x - ave_tmp)/(max_tmp-min_tmp)

#############################################################################

train_X = Normalizetion(train_X)

theta,J_his = GradientDescent(train_X,train_y,step_len,max_iterations)

# print('theta =',theta,'\n')

# print(Predict(test_X,theta))

train_time = range(0,len(J_his))

plt.plot(train_time, J_his)

plt.xlabel('train_time')

plt.ylabel('cost_fun_J')

plt.show()

kaggle gradient_descent的更多相关文章

kaggle入门2——改进特征
1:改进我们的特征在上一个任务中,我们完成了我们在Kaggle上一个机器学习比赛的第一个比赛提交泰坦尼克号:灾难中的机器学习. 可是我们提交的分数并不是非常高.有三种主要的方法可以让我们能够提高他: ...
Kaggle入门教程
此为中文翻译版 1:竞赛我们将学习如何为Kaggle竞赛生成一个提交答案(submisson).Kaggle是一个你通过完成算法和全世界机器学习从业者进行竞赛的网站.如果你的算法精度是给出数据集中最 ...
如何使用Python在Kaggle竞赛中成为Top15
如何使用Python在Kaggle竞赛中成为Top15 Kaggle比赛是一个学习数据科学和投资时间的非常的方式,我自己通过Kaggle学习到了很多数据科学的概念和思想,在我学习编程之后的几个月就开始 ...
kaggle实战记录 =>Digit Recognizer
date:2016-09-13 今天开始注册了kaggle,从digit recognizer开始学习, 由于是第一个案例对于整个流程目前我还不够了解,首先了解大神是怎么运行怎么构思,然后模仿.这样的 ...
kaggle数据挖掘竞赛初步--Titanic<原始数据分析&缺失值处理>
Titanic是kaggle上的一道just for fun的题,没有奖金,但是数据整洁,拿来练手最好不过啦. 这道题给的数据是泰坦尼克号上的乘客的信息,预测乘客是否幸存.这是个二元分类的机器学习问题 ...
kaggle& titanic代码
这两天报名参加了阿里天池的’公交线路客流预测‘赛,就顺便先把以前看的kaggle的titanic的训练赛代码在熟悉下数据的一些处理.题目根据titanic乘客的信息来预测乘客的生还情况.给了titan ...
kaggle 竞赛之套路
图片数据:卷积还是王道,有几个比较通用性的框架被人拿来改来改去非图片特征数据:用分类: boost系列算法:牛逼的框架实现 xgboost AdaBoost算法针对不同的训练集训练同一个基本分类器( ...
初窥Kaggle竞赛
初窥Kaggle竞赛原文地址: https://www.dataquest.io/mission/74/getting-started-with-kaggle 1: Kaggle竞赛我们接下来将要 ...
准备熟悉Kaggle -菜鸟进阶
原文链接http://www.bubuko.com/infodetail-525389.html 1.Kaggle简介 Kaggle是一个数据分析的竞赛平台,网址:https://www.kaggle ...

随机推荐

nginx配置允许指定域名下所有二级域名跨域请求
核心原理是根据请求域名匹配是否是某域名的二级域名判断是否添加允许跨越头. #畅游www server { listen 8015; server_name test-tl.changyou.com; ...
linux大于2T的磁盘格式化
fdisk默认只能格式小于2T的磁盘,我们经常会碰到大于2T的磁盘,我们不能fdisk 格式化. 我们得用parted 来的格式化 parted 命令可能没有,yum install -y parte ...
[BZOJ1797][AHOI2009]最小割Mincut
bzoj luogu sol 一条边出现在最小割集中的必要条件和充分条件. 先跑出任意一个最小割,然后在残余网络上跑出\(scc\). 一条边\((u,v)\)在最小割集中的必要条件:\(bel[u] ...
nodejs 安装 cnpm 命令
npm install -g cnpm --registry=https://registry.npm.taobao.org
基于spring及zookeeper的dubbo工程搭建
一.生产者搭建新建一个maven工程,勾选Create a simple project Packaging方式选择jar包的方式. 修改pom.xml文件: <project xmlns=& ...
angular +H5 上传图片与预览图片
//index.html <form class="form-horizontal"> <div class="panel panel-default& ...
Java创建AD（Active Directory）域控制器用户（未测）
import java.util.Hashtable; import javax.naming.ldap.*; import javax.naming.directory.*; import java ...
mycat sequence
数据库方式原理在数据库中建立一张表,存放sequence名称(name),sequence当前值(current_value),步长(increment int类型每次读取多少个sequence,假设 ...
git学习删除远程分支
2种方法删除远端分支: git branch -r -d origin/branch-name // -r: 远端: -d:删除 git push origin :branch-name ...
Xcode的Refactor使用
最近在看<重构>的书,想到Xcode有一个Refactor的功能,不知道您用的多不多,用这个功能在我们开发过程中,可以提高开发效率. Refactor 右键显示 Refactor 一.Re ...

kaggle gradient_descent

kaggle gradient_descent

1.描述

自写梯度下降

2.代码

kaggle gradient_descent的更多相关文章

随机推荐

热门专题