Data scientist———java实现常见的机器学习代码（跟百度深度学习研究院师兄学机器学习）

2016-05-02开始决定好好记录一切有关《数据科学家》的学习过程。记录学习笔记。

-------------------------------------------------------------------------------------------------

第一部分：14年跟百度T7师兄学了一段时间的机器学习基础知识。Java实现基础算法。复习一遍基础知识。

-------------------------------------------------------------------------------------------------

第六课，逻辑回归

-------------------------------------------------------------------------------------------------

http://www.cnblogs.com/keedor/p/4459196.html这个链接里面有公式推导。

损失函数loss function 由两部分构成：损失项（loss term） + 正则项（regularization term）。

通常而言，损失函数由损失项(loss term)和正则项(regularization term)组成。发现一份不错的介绍资料：

http://www.ics.uci.edu/~dramanan/teaching/ics273a_winter08/lectures/lecture14.pdf （题名“Loss functions; a unifying view”）。

一、损失项

对回归问题，常用的有：平方损失(for linear regression)，绝对值损失；
对分类问题，常用的有：hinge loss(for soft margin SVM)，log loss(for logistic regression)。

对hinge loss，又可以细分出hinge loss（或简称L1 loss）和squared hinge loss（或简称L2 loss）。国立台湾大学的Chih-Jen Lin老师发布的Liblinear就实现了这2种hinge loss。L1 loss和L2 loss与下面的regularization是不同的，注意区分开。

二、正则项

常用的有L1-regularization和L2-regularization。上面列的那个资料对此还有详细的总结。

这里的逻辑回归用的就是log loss。那么他的推导过程就是把似然函数写出来之后求出小L（theta）。然后loss function 取他的-1/m。这样就可以求出每一个theta的偏导。因为前面去了-1，所以依然用梯度下降来解。（最大似然求的是最大值，那么取反之后求的是最小值。）

实现的代码如下：

题目：

Problem Logistic Regression 逻辑回归

题目描述:

逻辑回归（Logistic Regression）是最基础、使用最广泛的机器学习分类算法之一。它以线

性回归为理论支持，在线性回归的基础上增加了sigmoid 函数(逻辑回归函数)，从而轻松处

理0/1 分类问题。在本题中，你需要使用梯度下降算法(gradient descent)实现一个线性回归

训练器。

具体如下：

已知逻辑回归方程，即估计函数(hypothesis)为:

其中n 为特征个数，θ0至θ												

											Data scientist———java实现常见的机器学习代码（跟百度深度学习研究院师兄学机器学习）的更多相关文章	

								机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总
		<Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.D ...
		
						机器学习(Machine Learning)&amp;深度学习(Deep Learning)资料
		机器学习(Machine Learning)&深度学习(Deep Learning)资料 機器學習.深度學習方面不錯的資料,轉載. 原作:https://github.com/ty4z2008 ...
		
						【课程学习】课程2：十行代码高效完成深度学习POC
		本文用户记录黄埔学院学习的心得,并补充一些内容. 课程2:十行代码高效完成深度学习POC,主讲人为百度深度学习技术平台部:陈泽裕老师. 因为我是CV方向的,所以内容会往CV方向调整一下,有所筛检. 课 ...
		
						【重磅干货整理】机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总
		[重磅干货整理]机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总 .
		
						Python、机器学习、计算机视觉、深度学习入门
		1.简明Python教程 2.Python计算机视觉编程 3.机器学习实践 4.吴恩达机器学习 5.李飞飞深度学习与计算机视觉
		
						机器学习如何选择模型 & 机器学习与数据挖掘区别 & 深度学习科普
		今天看到这篇文章里面提到如何选择模型,觉得非常好,单独写在这里. 更多的机器学习实战可以看这篇文章:http://www.cnblogs.com/charlesblc/p/6159187.html 另 ...
		
						开源项目kcws代码分析--基于深度学习的分词技术
		http://blog.csdn.net/pirage/article/details/53424544 分词原理 本小节内容参考待字闺中的两篇博文: 97.5%准确率的深度学习中文分词(字嵌入+Bi ...
		
						【机器学习基础】关于深度学习的Tips
		继续回到神经网络章节,上次只对模型进行了简要的介绍,以及做了一个Hello World的练习,这节主要是对当我们结果不好时具体该去做些什么呢?本节就总结一些在深度学习中一些基本的解决问题的办法. 为什 ...
		
						cocos2dx 之 android   java 与 c++ 互相调用 代码(以百度定位为例子)
		在作cocosdx项目移植到android上时,预见各种头痛问题,今天首先就说说如何在 java 中调用c++ 代码. 这里就用百度定位为例吧,也是我项目中的一小块内容.首先,先百度一下 “百度定位s ...
		
		
	

随机推荐	

									【ios开发】UITableViewCell的重用
			移动开发需要解决的一个问题就是资源稀缺的问题.多数情况下是内存问题. 虽然现在的手机都号称大内存,高配置.但是移动app所占用的资源也在跟着不断膨胀, 也是造成内存不足的主要原因. 在前面的例子中,还 ...
			
						用vue.js学习es6（三）：数组、对象和函数的解构
			一.数组的解构: 以前的方式: var arr = [1,2,3]; console.log(arr[0]); //1 console.log(arr[1]); //2 现在的方式: var [a,b ...
			
						jquery.on()超级方法
			$.on()方法是jquery1.7之后的一个超级方法,将事件绑定和事件委托整合到一个函数中去,支持绑定多个事件,并且可以绑定自定义事件.使用起来很方便. demo传送门 事件委托 首先说一下事件委托 ...
			
						oracle数据查询
			select * from XMBL_EM_DBBACK where f_djbh='DB01201612270013'select * from flow_task_list where biz_d ...
			
						被误解的MVC和被神化的MVVM(转)
			转载自:http://www.infoq.com/cn/articles/rethinking-mvc-mvvm 原文作者:唐巧 被误解的 MVC MVC 的历史 MVC,全称是 Model View ...
			
						hibernate缓存机制（转）
			原文出处:http://www.cnblogs.com/wean/archive/2012/05/16/2502724.html 一.why(为什么要用Hibernate缓存?) Hibernate是 ...
			
						Leetcode 365. Water and Jug Problem
			可以想象有一个无限大的水罐,如果我们有两个杯子x和y,那么原来的问题等价于是否可以通过往里面注入或倒出水从而剩下z. z =? m*x + n*y 如果等式成立,那么z%gcd(x,y) == 0.  ...
			
						Android 天猫apk聊天数据库解密
			1.使用Android 天猫apk 进行聊天会产生tmallWangXinDB的数据库.2.用sqlite3 工具打开提示加密或者错误.3.需要对该数据库进行解密. 解密流程:1.反编译apk,dex ...
			
						ubuntu10.04编译安装LAMP
			ubuntu10.04编译安装LAMP以及简单wordpress的使用 : http://linuxme.blog.51cto.com/1850814/971631 一.源码安装LAMP 网上有一堆关 ...
			
						nodejs异步处理
			采用Async.Q.Promise等第三方库处理异步回调 Async 安装 npm install async --save-dev

Data scientist———java实现常见的机器学习代码（跟百度深度学习研究院师兄学机器学习）

Data scientist———java实现常见的机器学习代码（跟百度深度学习研究院师兄学机器学习）的更多相关文章

随机推荐

热门专题