$\DeclareMathOperator{\lcm}{lcm}$ 本文的方法来源于GTM 190:"Problems in Algebraic Number Theory",给出了$\pi(x)\sim \Theta(\frac{x}{\log{x}})$的证明.以下使用的$p$隐含了$p$是素数的条件. 1. $\pi(x)\ge \frac{x\log{2}}{2\log{x}}$在$x\ge 6$成立 证明:(1)定义$\psi(x)=\sum_{p^\alpha \le x}…
推荐阅读 NOIp 数学知识点总结: https://www.cnblogs.com/greyqz/p/maths.html Basic 常用素数表:https://www.cnblogs.com/greyqz/p/9845627.html 快速幂 int qpow(int x, int y) { int res = 1; for (; y; x = (ll)x * x % mod, y >>= 1) if (y & 1) res = (ll)res * x % mod; return…
Dictum:  Life is just a series of trying to make up your mind. -- T. Fuller 不同于近似价值函数并以此计算确定性的策略的基于价值的RL方法,基于策略的RL方法将策略的学习从概率集合\(P(a|s)\)变换成策略函数\(\pi(a|s)\),并通过求解策略目标函数的极大值,得到最优策略\(\pi^*\),主要用的是策略梯度方法(Policy Gradient Methods). 策略梯度方法直接对随机策略\(\pi\)进行参…
Actor-Critic 是价值学习和策略学习的结合.Actor 是策略网络,用来控制agent运动,可以看做是运动员.Critic 是价值网络,用来给动作打分,像是裁判. 4. Actor-Critic 4.1 价值网络与策略网络构建 a. 原理介绍 状态价值函数: $ V_\pi(s)=\sum_{{a}}\pi({a}|{s})\cdot Q_\pi({s},{a})$ (离散情况,如果是连续的需要换成定积分) V 是动作价值函数 \(Q_\pi\) 的期望,\(\pi({s}|{a})\…
${\bf 解:}$ 在角状域$G=\{z\in\mathbb{C}|0<{\rm Arg}z<\frac{\pi}{2p}\}$上引入辅助函数$e^{iz^p}$, 其中$z^p=|z|^pe^{ip{\rm Arg}z}$,$0<{\rm Arg}z<\frac{\pi}{2p}$, 再设$0<\rho<R<+\infty$, 以及$\gamma_\rho=\partial B(0,\rho)\cap G$,$\gamma_R=\partial B(0,R)\…
已知向量$\textbf{a},\textbf{b}$满足:$|\textbf{a}|=|\textbf{b}|=1,\textbf{a}\cdot\textbf{b}=\dfrac{1}{2},\textbf{c}=(m,1-m),\textbf{d}=(n,1-n),(m,n\in R)$,存在$\textbf{a},\textbf{b}$,对于任意的实数$m,n$,不等式$|\textbf{a}-\textbf{c}|+|\textbf{b}-\textbf{d}|\ge T$ 恒成立,则…
x = cos x 的解析形式 玩计算器的发现 大家都玩过计算器吧, 不知注意到没有. 输入任意数, 然后不断按最后总会输出. 什么, 你说明明记得是:? 哦, 因为你用了角度制. 这一系列操作等价于求解方程, 角度制下就是. 当然对于现在的你来说求数值解没啥意思了, 要求就求解析解是吧. 不过这两个方程其实是一样的, 我们先变个形: 也就是说: 于是我们现在只要解决这一个方程了. 最早研究这个问题的是天文学家, 毕竟那时候也没什么计算器给你玩, 一切要从实际出发... 开普勒方程 你可能听说过…
位置传感器:旋转编码器          MCU:STM32F405RGT6          功率MOS驱动芯片:DRV8301 全文均假设在无弱磁控制的情况下 FOC算法理论 首先,我们要知道FOC是用来干什么的?有什么用?相比于BLDC的六步方波驱动有什么优点? 传统的六步方波驱动由于产生的磁场旋转运动不连续,导致电机转子受的驱动力矩发生突变(转矩脉动),即使通过增加电机极对数也不能的很好解决这一问题.另外由于方波驱动产生的驱动力不能全部的用于转子切线方向的转矩,还有一部分力损失在转子径向…
题目描述 $Treeland$国有$n$座城市,其中$1$号城市是首都,这些城市被一些单向高铁线路相连,对于城市$i\neq 1$,有一条线路从$i$到$p_i(p_i<i)$.每条线路都是一样长的,通过花费时间也是一样长的.这个国家的每一个城市都有一种特产,整个国家有$m$种特产(不同城市可能又相同的特产),其中城市$i$的特产用$a_i$表示.小$C$和他的几位$A$队爷朋友(总共$c$人,$2\leqslant c\leqslant 5$)正在$Treeland$国游玩,他们准备在一个城市…
在HT for Web提供了一下几种常用的Editor,分别是: slider:拉条 color picker:颜色选择器 enum:枚举类型 boolean:真假编辑器 string:普通的文本编辑器 除了这几种常用编辑器之外,用户还可以通过继承ht.widget.BaseItemEditor类来实现自定义编辑器. 而渲染器,在HT for Web提供常用的Renderer有: enum:枚举类型 color:颜色类型 boolean:真假渲染器 text:文本渲染器 和编辑器一样也可以自定义…