随机化算法属于省选芝士体系

0x01 前置芝士

你只需要会 rand 就可以啦!

当然如果你想理解的更透彻也可以先看看 爬山算法

0x02 关于退火

退火是一种金属热处理工艺,指的是将金属缓慢加热到一定温度,保持足够时间,然后以适宜速度冷却。目的是降低硬度,改善切削加工性;消除残余应力,稳定尺寸,减少变形与裂纹倾向;细化晶粒,调整组织,消除组织缺陷。准确的说,退火是一种对材料的热处理工艺,包括金属材料、非金属材料。而且新材料的退火目的也与传统金属退火存在异同。

也就是你可以理解为,金属在逐渐降温的过程中,它含的某种物质会趋于恒定。

换成 OI 的话说,如果每个温度对应一个答案,则随着温度越来越小,答案波动的范围就会越来越小,最后答案趋于恒定。例如下面这个经典图片,便是利用这个思想,最后得到了一个多峰函数的最值。模拟退火就是用于求解多峰函数的最值问题。

不过是不是看起来很玄学?现在我们来细化一下模拟退火思想。

0x03 模拟退火

你如果仔细看,刚刚那个图中答案好像和温度没有直接联系,也就是说答案是随机的。这个说法不太完全,答案和温度确实没有太大联系,但温度却可以限定答案所在的范围。

首先我们引入几个参数:当前最优解 \(A_0\),新的解 \(A\),上一个被接纳的解 \(A_1\),解的“变动量” \(ΔA\)(即 \(A\) 与 \(A_0\) 的差值,这里规定为 \(A - A_0\)),开始的温度 \(T_0\),当前温度 \(T\),最终的温度 \(T_{esp}\)。温度变动量 \(q\)。接纳:指对于一个解,我们认为它有可能是正确答案,或者说与正确答案有联系。

以下均以求多峰函数最大值为例来模拟整个过程。

首先在一开始,我们找到一个你认为接近正确答案的解 \(A_1\),将 \(A_0\) 初始置为 \(A_1\)。然后你需要在温度限制的范围内,去合理的再取到一个解,即 \(A\)。至于这个温度限制的范围其实很简单,你只需要求到一个满足条件的随机数即可。例如:你有一个横坐标,如果你要再求到一个横坐标,你就可以写成。

double cx = now.x + ((rand() << 1) - RAND_MAX) * t;
// RAND_MAX 是 <stdlib.h> 中的一个宏,也就是随机数的最大值。
// 通过 (rand << 1) - RAND_MAX 我们就得到了一个可能为正可能为负的随机数

这样的话,你就会发现随着 \(T\) 的不断减小,新的解与上一个解的差距就越小,即达到了我们的目的。

现在我们有了 \(A\),自然就可以求到所谓 \(ΔA\)。

得到 \(ΔA\)后:

  • \(ΔA > 0\) :也就是说当前解大于当前最优解,因为我们是求最大值,所以此时显然更新 \(A_0\),并更新 \(A_1 = A\)。

  • \(ΔA \leq 0\) :这就比较麻烦了,首先这样的情况是肯定不能更新 \(A_0\) 的。但我们考虑一下 \(A_1\),如果接纳 \(A\),那么我们下次就是从 \(A\) 开始扩展新的点,这很明显有可能不是最优的(你从多峰函数的一个峰的半山腰跌到了一个山谷)。但也有可能是更优的,因为你现在接纳的这个点,它可能不在最终答案的那一座峰上,所以你需要跳往另一座峰,也就是你需要接纳 \(A\)。这下该怎么办呢?有一个非常玄学的东西,叫:Metropolis接受准则。它告诉我们有一定概率去接纳 \(A\),而这个概率只需比较 \(\exp(-delta / t) * RAND\_MAX\) 和 \(rand()\) 的大小即可。

在做完这些操作后,我们让 \(T = T \times q\)。

好了,我们现在又有了一个 \(A_1\),这个 \(A_1\) 可能等于 \(A_0\) 也可能等于 \(A\)。我们将这个 \(A_1\) 再去执行上述操作,反复执行,随着温度的减小,我们就可以求到一个趋于恒定的答案了!

当然还有几个未处理的地方。

首先:

  1. \(T_0\) 的取值:根据题目而定,我通常使用 \(2000\) 到 \(5000\) 的一个整数。
  2. \(q\) 的取值:在前人的总结中,\(q\) 近似于 \(0.996\)。
  3. \(T_{esp}\) 的取值:这也需要视题目而定,如果这个值越小,按理说答案精度就越大,所以如果你不怕超时就可以开的小一点。

最后,关于时间复杂度,因为此算法使用了大量随机数,所以其时间复杂度近似于 \(O(rp)\)。

0x04 例题

LINK

一句话题意:给定 \(n\) 个坐标,求这 \(n\) 个坐标的 费马点

定义 \(sum\) 表示一个坐标到 \(n\) 个点的距离和。

首先,你会发现答案是一个函数,因为一个坐标只对应一个 \(sum\)。于是我们其实就是要求这个多峰函数 \(sum\) 的最小值。

那么就是模拟退火嘛。读者可以在根据下面这个代码理解一下实现。

值得注意的是,这道题函数 \(sum\) 的“横坐标”是一个坐标。

#include <bits/stdc++.h>
using namespace std; int read() {
int k = 1, x = 0;
char s = getchar();
while (s < '0' || s > '9') {
if (s == '-')
k = -1;
s = getchar();
}
while (s >= '0' && s <= '9') {
x = (x << 3) + (x << 1) + s - '0';
s = getchar();
}
return x * k;
} const int MAXN = 5e3 + 5;
const double q = 0.996;
// 温度变动量
struct node {
double x, y;
node() {}
node(double X, double Y) {
x = X;
y = Y;
}
} a[MAXN], now, anst;
// now 初值为 A1,在这里是 (0, 0)
double ans = 1e18;
// 答案初值 int n;
double f(double x, double y) {
double ret = 0;
for (int i = 1; i <= n; i++) ret += sqrt((x - a[i].x) * (x - a[i].x) + (y - a[i].y) * (y - a[i].y));
return ret;
} void Make_Fire() {
double t = 3000;
while (t > 1e-16) {
double cx = now.x + ((rand() << 1) - RAND_MAX) * t;
double cy = now.y + ((rand() << 1) - RAND_MAX) * t;
// 求到 A 的横坐标,在这里是 (cx, cy)
double cnt = f(cx, cy);
// 求到 A
double delta = cnt - ans;
// 求到差
if (delta < 0) { // 如果差是小于 0 的
now = node(cx, cy);
// 接纳它
anst = node(cx, cy);
// 根据题目需要,更新答案的坐标
ans = cnt;
// 跟新答案
} else if (exp(-delta / t) * RAND_MAX > rand())
// 玄学接受准则
now = node(cx, cy);
// 接纳它
t *= q;
// 降温
}
} int main() {
srand(998244353);
n = read();
ans = 1e18;
for (int i = 1; i <= n; i++)
scanf("%lf %lf", &a[i].x, &a[i].y);
for (int i = 1; i <= 5; i++) Make_Fire();
printf("%.2lf %.2lf\n", anst.x, anst.y);
return 0;
}

Note -「模拟退火」的更多相关文章

  1. Note -「多项式」基础模板(FFT/NTT/多模 NTT)光速入门

      进阶篇戳这里. 目录 何为「多项式」 基本概念 系数表示法 & 点值表示法 傅里叶(Fourier)变换 概述 前置知识 - 复数 单位根 快速傅里叶正变换(FFT) 快速傅里叶逆变换(I ...

  2. Note -「群论」学习笔记

    目录 前置知识 群 置换 Burnside 引理与 Pólya 定理 概念引入 引例 轨道-稳定子(Orbit-Stabilizer)定理 证明 Burnside 引理 证明 Pólya 定理 证明 ...

  3. Note -「线性规划」学习笔记

    \(\mathcal{Definition}\)   线性规划(Linear Programming, LP)形式上是对如下问题的描述: \[\operatorname{maximize}~~~~z= ...

  4. Note -「计算几何」模板

      尚未完整测试,务必留意模板 bug! /* Clearink */ #include <cmath> #include <queue> #include <cstdi ...

  5. loj#2076. 「JSOI2016」炸弹攻击 模拟退火

    目录 题目链接 题解 代码 题目链接 loj#2076. 「JSOI2016」炸弹攻击 题解 模拟退火 退火时,由于答案比较小,但是温度比较高 所以在算exp时最好把相差的点数乘以一个常数让选取更差的 ...

  6. Note -「Lagrange 插值」学习笔记

    目录 问题引入 思考 Lagrange 插值法 插值过程 代码实现 实际应用 「洛谷 P4781」「模板」拉格朗日插值 「洛谷 P4463」calc 题意简述 数据规模 Solution Step 1 ...

  7. Note -「动态 DP」学习笔记

    目录 「CF 750E」New Year and Old Subsequence 「洛谷 P4719」「模板」"动态 DP" & 动态树分治 「洛谷 P6021」洪水 「S ...

  8. Note -「圆方树」学习笔记

    目录 圆方树的定义 圆方树的构造 实现 细节 圆方树的运用 「BZOJ 3331」压力 「洛谷 P4320」道路相遇 「APIO 2018」「洛谷 P4630」铁人两项 「CF 487E」Touris ...

  9. Note -「Dsu On Tree」学习笔记

    前置芝士 树连剖分及其思想,以及优化时间复杂度的原理. 讲个笑话这个东西其实和 Dsu(并查集)没什么关系. 算法本身 Dsu On Tree,一下简称 DOT,常用于解决子树间的信息合并问题. 其实 ...

随机推荐

  1. 基于casbin的RBAC权限实践

    五一假期疫情封在家也没事做,就想来优化一下一个前端容器小项目 之前的TODOlist里面有一项是权限这块时隔2年了还一直没有动手 迟迟没搞主要还是我太懒了,哈哈 其实我一直想要找一个轻量级的权限通用方 ...

  2. 实战| Nginx+keepalived 实现高可用集群

    一个执着于技术的公众号 前言 今天通过两个实战案例,带大家理解Nginx+keepalived 如何实现高可用集群,在学习新知识之前您可以选择性复习之前的知识点: 给小白的 Nginx 10分钟入门指 ...

  3. C#/VB.NET 在Excel单元格中应用多种字体格式

    在Excel中,可对单元格中的字符串设置多种不同样式,通常只需要获取到单元格直接设置样式即可,该方法设置的样式会应用于该单元格中的所有字符.如果需要对单元格中某些字符设置样式,则可以参考本文中的方法. ...

  4. 分享一下 Idea 的 scope 功能

    分享一下 Idea 的 scope 功能 事情的起因是我在使用 idea 的call hierarchy功能时,觉得它没有像find usage那样有排除功能,并且如果点击了展开全部,当代码中使用了某 ...

  5. css,html实现元素超出部分省略号

    .line-1 { height: 25px; width: 200px; overflow: hidden; text-overflow: ellipsis; display: -webkit-bo ...

  6. .NET MAUI 正式版GA发布

    .NET MAUI – 一个代码库,多个平台 欢迎使用 .NET 多平台应用 UI.此版本标志着我们统一 .NET 平台的多年旅程中的新里程碑.现在,您和超过 500 万其他 .NET 开发人员拥有了 ...

  7. 02-C高级编程

    Day01 笔记 1 typedef使用 1.1 起别名 - 简化struct关键字 1.2 区分数据类型 1.3 提高代码移植性 2 void使用 2.1 不可以利用void创建变量 无法给无类型变 ...

  8. Change Buffer 只适用于非唯一索引页?错

    最近在网上看到一些文章里说:"change buffer 只适用于非唯一索引页."其实这个观点是错的,先来看看官方文档对 change buffer 的介绍: 文档地址:https ...

  9. [USACO2021DEC] HILO 踩标做法

    [USACO2021DEC] HILO Solution 参考自 官方题解 里提到的一篇 Obliteration.pdf,但是里面作者写出了极多错误...然后式子还错错得对了. 令 \(y=n-x\ ...

  10. dotnet-cnblog-tool 图片上传失败问题

    dotnet-cnblog-tools 这个工具是将本地的 Markdown 文件转换为 可以上传到 cnblog 的格式,并且会将图片自动上传到 cnblog 的图床. 具体可以参考这篇文章: cn ...