SGD

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.Threading.Tasks;

namespace ConsoleApp4

{

    class Program

    {

        static void Main(string[] args)

        {

            List<float[]> inputs_x = new List<float[]>();

            inputs_x.Add( new float[] { 0.9f, 0.6f});

            inputs_x.Add(new float[] { 2f, 2.5f } );

            inputs_x.Add(new float[] { 2.6f, 2.3f });

            inputs_x.Add(new float[] { 2.7f, 1.9f });

            List<float> inputs_y = new List<float>();

            inputs_y.Add( 2.5f);

            inputs_y.Add( 2.5f);

            inputs_y.Add( 3.5f);

            inputs_y.Add( 4.2f);

            float[] weights = new float[3];

            for (var i= 0;i < weights.Length;i++)

                weights[i] = (float)new Random().NextDouble();

            int epoch = 30000;

            float epsilon =0.00001f;

            float lr = 0.01f;

            float lastCost=0;

            for (var epoch_i = 0; epoch_i <= epoch; epoch_i++)

            {

                //随机获取input

                var batch = GetRandomBatch(inputs_x, inputs_y, 2);

                float[] weights_in_poch = new float[weights.Length];

                foreach (var x_y in batch)

                {

                    var x1 = x_y.Item1.First();

                    var x2 = x_y.Item1.Skip(1).Take(1).First();

                    var target_y = x_y.Item2;

                    float diffWithTargetY = target_y - fun(x1, x2, weights[1], weights[2], weights[0]);

                    weights_in_poch[0] += diffWithTargetY * dy_b(x1, x2);

                    weights_in_poch[1] +=  diffWithTargetY * dy_theta1(x1, x2);

                    weights_in_poch[2] += diffWithTargetY * dy_theta2(x1, x2);

                }

                for(var i=0;i<weights.Length;i++)

                    weights[i] += lr * weights_in_poch[i];

                float totalErrorCost = 0f;

                foreach (var x_y in batch)

                {

                    var x1 = x_y.Item1.First();

                    var x2 = x_y.Item1.Skip(1).Take(1).First();

                    var target_y = x_y.Item2;

                    float diffWithTargetY = target_y - fun(x1, x2, weights[1], weights[2], weights[0]);

                    totalErrorCost += (float)System.Math.Pow(diffWithTargetY, 2)/2;

                }

                float cost = totalErrorCost / batch.Count;

                if (System.Math.Abs(cost - lastCost) <= epsilon)

                {

                    Console.WriteLine(string.Format("EPOCH {0}", epoch_i));

                    Console.WriteLine(string.Format("LAST MSE {0}", lastCost));

                    Console.WriteLine(string.Format("MSE {0}", cost));

                    break;

                }

                lastCost = cost;

                if (epoch_i % 100 == 0|| epoch_i==epoch)

                {

                    Console.WriteLine(string.Format("MSE {0}", cost));

                }

            }

            print(weights[1], weights[2], weights[0]);

            Console.ReadLine();

        }

        private static List<Tuple<float[], float>> GetRandomBatch(List<float[]> inputs_x, List<float> inputs_y, int maxCount)

        {

            List<Tuple<float[], float>> lst = new List<Tuple<float[], float>>();

            System.Random rnd = new Random((int)DateTime.Now.Ticks);

            int count = 0;

            while (count<maxCount)

            {

                int rndIndex = rnd.Next(inputs_x.Count);

                var item=Tuple.Create<float[], float>(inputs_x[rndIndex], inputs_y[rndIndex]);

                lst.Add(item);

                count++;

            }

            return lst;

        }

        private static void print(float theta1, float theta2, float b)

        {

            Console.WriteLine(string.Format("y={0}*x1+{1}*x2+{2}", theta1, theta2, b));

        }

        private static float fun(float x1, float x2, float theta1, float theta2, float b)

        {

            return theta1 * x1 + theta2 * x2 + b;

        }

        private static float dy_theta1(float x1, float x2)

        {

            return x1;

        }

        private static float dy_theta2(float x1, float x2)

        {

            return x2;

        }

        private static float dy_b(float x1, float x2)

        {

            return 1;

        }

    }

}

SGD的更多相关文章

[Machine Learning] 梯度下降法的三种形式BGD、SGD以及MBGD
在应用机器学习算法时,我们通常采用梯度下降法来对采用的算法进行训练.其实,常用的梯度下降法还具体包含有三种不同的形式,它们也各自有着不同的优缺点. 下面我们以线性回归算法来对三种梯度下降法进行比较. ...
为什么是梯度下降？SGD
在机器学习算法中,为了优化损失函数loss function ,我们往往采用梯度下降算法来进行优化.举个例子: 线性SVM的得分函数和损失函数分别为: ...
【原创】batch-GD， SGD， Mini-batch-GD， Stochastic GD， Online-GD -- 大数据背景下的梯度训练算法
机器学习中梯度下降(Gradient Descent, GD)算法只需要计算损失函数的一阶导数,计算代价小,非常适合训练数据非常大的应用. 梯度下降法的物理意义很好理解,就是沿着当前点的梯度方向进行线 ...
逻辑回归：使用SGD(Stochastic Gradient Descent)进行大规模机器学习
Mahout学习算法训练模型 mahout提供了许多分类算法,但许多被设计来处理非常大的数据集,因此可能会有点麻烦.另一方面,有些很容易上手,因为,虽然依然可扩展性,它们具有低开销小的数据集.这样一个 ...
[Machine Learning] 梯度下降（BGD）、随机梯度下降（SGD）、Mini-batch Gradient Descent、带Mini-batch的SGD
一.回归函数及目标函数以均方误差作为目标函数(损失函数),目的是使其值最小化,用于优化上式. 二.优化方式(Gradient Descent) 1.最速梯度下降法也叫批量梯度下降法Batch Gr ...
监督学习：随机梯度下降算法（sgd）和批梯度下降算法（bgd）
线性回归首先要明白什么是回归.回归的目的是通过几个已知数据来预测另一个数值型数据的目标值. 假设特征和结果满足线性关系,即满足一个计算公式h(x),这个公式的自变量就是已知的数据x,函数值h(x)就 ...
tensorflow实现最基本的神经网络 + 对比GD、SGD、batch-GD的训练方法
参考博客:https://zhuanlan.zhihu.com/p/27853521 该代码默认是梯度下降法,可自行从注释中选择其他训练方法在异或问题上,由于训练的样本数较少,神经网络简单,训练结果 ...
深度学习——优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
【深度学习】深入理解优化器Optimizer算法（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
【DeepLearning】优化算法：SGD、GD、mini-batch GD、Moment、RMSprob、Adam
优化算法 1 GD/SGD/mini-batch GD GD:Gradient Descent,就是传统意义上的梯度下降,也叫batch GD. SGD:随机梯度下降.一次只随机选择一个样本进行训练和 ...

随机推荐

Linux ext2文件系统之初步思考
数据存放在磁盘中,磁盘最小存取单位sector(512Byte);文件系统中存储的最小单位是块(Block),大小通常(1KB,2KB,4KB...), 一个block对应多个sector,因而可用 ...
在vi按了ctrl+s后
习惯了在windows下写程序,也习惯了按ctrl+s 保存代码,在用vi的时候,也习惯性的按ctrl+s 结果就是如同终端死掉了一样. 原来: ctrl+s 终止屏幕输出(即停止回显),你敲的依然有 ...
Linux端图形处理工具ImageMagick在Centos上的安装
一.安装背景程序要用到用户上传图片,编辑的功能,能进行旋转,裁剪,缩放等. 二.ImageMagick介绍 ImageMagick是用C语言开发图片处理程序.可以对图片进行改变大小.旋转.锐化.减色或 ...
启用 Brotli 压缩算法，对比 Gzip 压缩 CDN 流量再减少 20%
Google 认为互联网用户的时间是宝贵的,他们的时间不应该消耗在漫长的网页加载中,因此在 2015 年 9 月 Google 推出了无损压缩算法 Brotli.Brotli 通过变种的 LZ77 算 ...
来手撸一个小小小小小"3D引擎"
开始的唠叨说是3D引擎确实有点过于博眼球了,其实就是实现了一个透视投影,当然也不是那么简单的. 此篇文章是纯粹给小白看的高手请勿喷 .也称之为小向带你图形学入门基础 . 哇哈哈哈哈一说到做一个3 ...
二叉树、栈、队列、链表的Java代码实现
这是我的学习总结. 如有文章存在谬误,欢迎指出,有其他意见或者建议,也欢迎留言二叉树链表前序遍历:先访问根节点,然后访问左子树.右子树中序遍历:先访问左子树,然后访问根节点.右子树后序遍历:先 ...
python解释执行原理(转载)
Python解释执行原理转自:http://l62s.iteye.com/blog/1481421 这里的解释执行是相对于编译执行而言的.我们都知道,使用C/C++之类的编译性语言编写的程序,是需要 ...
python_day05(去爬登录的豆瓣)
# 爬豆瓣需要用cookie# 需要注意隐藏的参数,即input 里面的默认的一些参数# 需要自己注册一个账户密码import urllib.requestimport http.cookiejarf ...
RAC环境下误操作将数据文件添加到本地存储
今天碰到个有意思的事情,有客户在Oracle RAC环境,误操作将新增的数据文件直接创建到了其中一个节点的本地存储上. 发现网上去搜的话这种问题还真不少,对应解决方案也各式各样,客户问我选择哪种方案可 ...
在centos上搭建SVN服务器和MySQL
----------搭建MySQL--------------- 1.查看yum库中的mysql yum list | grep mysql //查看yum库中的mysql 2.选择需要的mysql进 ...

SGD

SGD的更多相关文章

随机推荐

热门专题