以下笔记参考自Boyd老师的教材【Convex Optimization】。

I. Mathematical Optimization

1.1 定义

数学优化问题(Mathematical Optimization) 有如下定义:

\[
\begin{align}
&minimize \, f_0(x) \notag \\
&subject \, to \, f_i(x)≤b_i, \, i=1,...,m \tag{1.1}
\end{align}
\]

向量$x=(x_1,...,x_n)$是优化问题中的优化变量(optimization variable)。
函数$f_0:R^n→R$是 目标函数。
函数$f_i:R^n→R, i=1,...,m$是限制函数(constraint function)。

何为最优呢？我们有如下定义：

当对于满足限制条件$f_1(z)≤b_1,...,f_m(z)≤b_m$任意变量$z$,都有$f_0(z)≥f_0(x^*)$,则称$x^*$为最优(optimal)。

分类
当定义(1.1)中的满足如下条件时，称该优化问题为线性规划(linear program)。
\[f_i(αx+βy)=αf_i(x)+βf_i(y) \tag{1.2}\]

其中$x,y∈R^n$且 $α,β∈R$。

同理当不满足(1.2)的优化问题则成为非线性规划(nonlinear program)。

凸优化问题(Convex Optimization) 需满足的条件相比线性规划更加广泛，所以后者也可以理解为前者的一个子集，凸优化需满足的条件如下：
\[f_i(αx+βy)≤αf_i(x)+βf_i(y) \tag{1.3}\]

理解定义
光看定义(1.1)不太直观，举个栗子直观理解理解一下：

我们都知道在机器学习中我们的目标是需要基于一些先验知识，找到一个模型对数据进行拟合。此时优化变量$x$就是模型中的参数,限制函数就是那些先验知识以及对超参数的限制等等，目标函数就是(以分类问题为例)模型对数据拟合的准确度。

不同优化算法之间的有效性不同，而且一般都取决于这些因素:

目标函数和约束函数的特殊形式
优化变量和约束(constraints)的数量
特殊的结构(sparsity 稀疏结构)

1.2 最小二乘法&线性规划

Least-squares and linear programming

1.2.1 最小二乘问题

定义
最小二乘问题(least-squares) 没有约束，也就是说此时定义(1.1)中的$m=0$,其目标函数定义如下：
\[minimize \, f_0(x)=||Ax-b||^2_2=\sum_{i=1}^k(a_i^Tx-b_i)^2 \tag{1.4}\]

其中$A∈R^{k×n}\,(k≥n)$,$a_i^T$是A的行向量，$x∈R^n$是优化变量。

求解
求解(1.4)中的优化问题可化简为一组线性方程，即：
\[(A^TA)x=A^Tb\]
解为$x=(A^TA)^{-1}A^Tb$。
应用
如今的算法和软件已经能非常高效的求解出最小二乘优化问题了，即使是成千上万的变量(variable)和项(term),都可以在一分钟以内计算出来(一般都要求是稀疏模式)。所以如果能把优化问题转变成最小二乘法优化问题，一切就简单很多了。

1.2.2 线性规划

定义
线性规划定义如下:
\[
\begin{align}
&minimize \, c^Tx \notag \\
&subject \, to \, a_i^Tx≤b_i, i=1,...,m \tag{1.5}
\end{align}
\]

其中$c, a_1,... ,a_m ∈ R^n$ and 标量 $b_1, . . . , b_m ∈ R$。

求解
求解线性规划没有像最小二乘那样的简化公式，但是还是有各种各样的方法的，例如Dantzig's simplex method以及interior-point methods(复杂度一般为$n^2m\,(m≥n)$阶)。
应用
虽然将原始的优化问题转化为线性规划问题要比转化为最小二乘法优化问题复杂得多，但是也不是那么难。已经有部分软件系统可以自动转化优化问题为线性规划了。

1.3 凸优化

定义
其实凸优化已经在前面介绍过了，这里再重新介绍一下。凸优化问题定义如下：
\[
\begin{align}
& minimize \, f_0(x) \notag \\
& subject \, to \, f_i(x)≤b_i, \, i=1,...,m \notag \\
& f_i(αx+βy)≤αf_i(x)+βf_i(y) \tag{1.6}
\end{align}
\]
其中$x,y∈R^n$且 $α,β∈R \, with \, \alpha+\beta=1, \alpha≥0,\beta≥0$。
求解
对于凸优化问题而言，并没有像最小二乘法优化问题那样的求解公式，但是interior-point methods也不失为一个不错的方法。
应用
将优化问题转化为凸优化问题要比上面两个更难一些，这个转化过程需要不少技巧，但是只要转化成功，求解起来就和上面两种优化问题一样简单了。

1.4 非线性规划

非线性规划(nonlinear programming)也叫非线性优化(nonlinear optimization)。

注意：非线性优化问题可能是也可能不是凸优化问题。

此时优化问题解可划分成局部最优解，全局最优解。

1.5 大纲

本书的大纲如下：

Part I： Theory
- Chapter 2：Convex Sets(凸集)
- Chapter 3：Convex functions(凸函数)
- Chapter 4：Convex optimization problems
- Chapter 5： Lagrangian duality （拉格朗日对偶）
Part II: Applications（主要介绍凸优化是如何应用在实际中的）
Part III: Algorithms
- unconstrained optimization
- equality constrained optimization
- inequality constrained optimization
  
  第三部分算法主要分三个阶段：
  1.Base level:二次方优化(如最小二乘)
  2.Next level:牛顿算法(Newton's method)，用于解决非约束或者等式约束问题
  3.Top level:内点算法(Interior-point methods)，解决不等式约束问题

【Convex Optimization (by Boyd) 学习笔记】Chapter 1 - Mathematical Optimization的更多相关文章

【Convex Optimization (by Boyd) 学习笔记】Chapter 2 - Convex sets(1) 仿射集&凸集
I. 仿射凸集(Affine and convex sets) 1. 线与线段假设$R^n$空间内两点$x_1,x_2\, (x_1≠x_2)$,那么\(y=\theta x_1+(1-\t ...
神经网络与深度学习笔记 Chapter 1.
转载请注明出处:http://www.cnblogs.com/zhangcaiwang/p/6875533.html sigmoid neuron 微小的输入变化导致微小的输出变化,这种特性将会使得学 ...
神经网络与深度学习笔记 Chapter 6之卷积神经网络
深度学习 Introducing convolutional networks:卷积神经网络介绍卷积神经网络中有三个基本的概念:局部感受野(local receptive fields), 共享权重 ...
神经网络与深度学习笔记 Chapter 3.
交叉熵交叉熵是用于解决使用二次代价函数时当单个神经元接近饱和的时候对权重和bias权重学习的影响.这个公式可以看出,当神经元饱和的时候,sigma的偏导接近于0,w的学习也会变小.但是应用交叉熵作为 ...
神经网络与深度学习笔记 Chapter 2.
转载请注明出处http://www.cnblogs.com/zhangcaiwang/p/6886037.html 以前都没有正儿八经地看过英文类文档,神经网络方面又没啥基础,结果第一章就花费了我将近 ...
Python学习笔记–Chapter 2
1.字符串中添加制表符,可使用字符组合\t 2.字符串中添加换行符,可使用字符组合\n 3.字符串\n\t可以换到下一行,并且在开头添加一个制表符. 4.删除末尾空白,使用方法rstrip() 5.删 ...
Python学习笔记 chapter 2基础
程序输入 >>> print('%s is number %d'%('Python', 1))Python is number 1 输出重定向有问题(待定) 文本输入>> ...
蟒蛇书学习笔记——Chapter 09 Section 01 创建和使用类
9.1 创建和使用类 9.1.1 创建Dog类根据Dog类创建的每个实例都将存储名字和年龄,我们赋予了每条小狗蹲下(sit( ))和打滚(roll_over( ))的能力: class Dog: ...
jQuery的学习笔记
JQuery学习笔记 Chapter one初识jQuery 1.2测试jQuery 在jQuery库中,$是jQuery的别名,如:$()相当于jQuery() 注意:在使用JQuery进行开发的时 ...

随机推荐

多态（instanceof）
多态调用的三种格式 * A:多态的定义格式: * 就是父类的引用变量指向子类对象父类类型变量名 = new 子类类型(); 变量名.方法名(); * B: 普通类多态定义的格式父类变量名 = ...
day05-(validate&bootstred)
网站分享: http://www.runoob.com/ 回顾: html:展示文件标签: <html> <head> <title></title> ...
MySQL双主+keeplived安装部署说明
MySQL双主+keeplived安装部署说明一.环境介绍 1.1.规划序号类别版本主机名 IP 端口备注 1 OS CentOS release 6.9 (Final) (minimal ...
运维监控-Zabbix Server 使用微信 WeChat 告警
运维监控-Zabbix Server 使用微信 WeChat 告警作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 微信公众号告警每个一天只支持1000次告警,如果超出这个次数了就不 ...
Tensorflow搞一个聊天机器人
catalogue . 前言 . 训练语料库 . 数据预处理 . 词汇转向量 . 训练 . 聊天机器人 - 验证效果 0. 前言不是搞机器学习算法专业的,3个月前开始补了一些神经网络,卷积,神经网络 ...
HDU 1015(字符运算 **)
题意是在一段大写英文字符中找出 5 个字符通过代入公式运算得到目标值,如有多组字符满足题意,则输出字典序最大的一组,否则输出 no solution. 应该是用深搜做的,但是直接暴力也过了……(应该没 ...
npm scripts 脚本基础指南
什么是npm脚本? npm 允许在package.json文件里面,使用scripts字段定义脚本命令. 初始化package.json -> npm init -> 经历一系列的问答即可 ...
python模块之os sys shutil
os模块 os模块是与操作系统交互的一个接口 #当前执行这个python文件的工作目录相关的工作路径 os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir( ...
Bitcoin Core钱包客户端的区块数据搬家指南
最近在饭团(微信中的一个服务号)里教一些朋友学习比特币和区块链技术,为了让大家深刻地理解去中心化网络和钱包等概念,我推荐大家一定要安装经典的Bitcoin Core钱包软件,有些朋友在安装的时候没有留 ...
【转载】详解KMP算法
网址:https://www.cnblogs.com/yjiyjige/p/3263858.html

【Convex Optimization (by Boyd) 学习笔记】Chapter 1 - Mathematical Optimization