C# 7开始,C#加快了迭代速度,多方面的打磨让C#在易用性,效率等各方面都向完美靠近.另外得益于开源,社区对C#的进步也做了很大共享.下面带领大家看看C# 7的新特性.其中一部分是博主已经使用过,没用过的根据官方文档进行了整理. out变量 有一定C#编程经历的园友一定没少写如下这样的代码: int speed; if (int.TryParse(speedStr, out speed)) speed*=10; 为了增加程序的健壮性,在进行类型转换时使用TryXXX方法是很好的实践.但由于这样…
目录 值函数的近似 DQN Nature DQN DDQN Prioritized Replay DQN Dueling DQN 参考 DQN发展历程(一) DQN发展历程(二) DQN发展历程(三) DQN发展历程(四) DQN发展历程(五) 值函数的近似 当状态-动作数目太多时,使用表格存储所有的状态-动作会造成维度灾难,无法求解大规模问题. 可以采用一个函数来近似这个这个表格,输入状态-动作,输出对应的状态值. 可以使用神经网络来充当这个近似函数. DQN 使用来一个神经网络来作为近似函数…
C#的发展历程第五 - C# 7开始进入快速迭代道路 C#与C++的发展历程第四 - C#6的新时代 C#与C++的发展历程第三 - C#5.0异步编程巅峰 C#与C++的发展历程第二 - C#4.0再接再厉 C#与C++的发展历程第一 - 由C#3.0起   出处:https://www.cnblogs.com/lsxqw2004/category/743315.html…
系列文章目录 1. C#与C++的发展历程第一 - 由C#3.0起 2. C#与C++的发展历程第二 - C#4.0再接再厉 3. C#与C++的发展历程第三 - C#5.0异步编程的巅峰 C#5.0作为第五个C#的重要版本,将异步编程的易用度推向一个新的高峰.通过新增的async和await关键字,几乎可以使用编写同步代码的方式来编写异步代码. 本文将重点介绍下新版C#的异步特性以及部分其他方面的改进.同时也将介绍WinRT程序一些异步编程的内容. C# async/await异步编程 写as…
Java的发展历程充满了传奇色彩. 最初,Java是由Sun公司的一个研究小组开发出来的, 该小组起先的目标是想用软件实现对家用电器进行集成控制的小型控制装置. 开始,准备采用C++,但C++太复杂,而且安全性差,最后基于C++开发了一种新的语言Oak, 据说当时是小组成员之一Gosling在苦思冥想这种语言的名字时,正好看到了窗外的一颗橡树, Oak在英文里是"橡树"的意思,所以给该语言命名为Oak. 它是一种用于网络的精巧而安全的语言,但是这个在技术上非常成功的产品在商业上却几近失…
目录 不基于模型(Model-free)的预测 蒙特卡罗方法 时序差分方法 多步的时序差分方法 参考 DQN发展历程(一) DQN发展历程(二) DQN发展历程(三) DQN发展历程(四) DQN发展历程(五) 不基于模型(Model-free)的预测 无法事先了解状态转移的概率矩阵 蒙特卡罗方法 从开始状态开始,到终结状态,找到一条完整的状态序列,以求解每个状态的值.相比于在整个的状态空间搜索,是一种采样的方法. 对于某一状态在同一状态序列中重复出现的,有以下两种方法: 只选择第一个状态进行求…
目录 不基于模型的控制 选取动作的方法 在策略上的学习(on-policy) 不在策略上的学习(off-policy) 参考 DQN发展历程(一) DQN发展历程(二) DQN发展历程(三) DQN发展历程(四) DQN发展历程(五) 不基于模型的控制 选取动作的方法 贪婪法,每次控制都选择状态值最大的动作,容易局部收敛,找不到全局最优. 引入 epsilon-greedy,按 epsilon 的概率随机选择一个动作,按 1 - epsilon 的概率使用贪婪法,选择状态值最大的动作 在策略上的…
目录 动态规划 使用条件 分类 求解方法 参考 DQN发展历程(一) DQN发展历程(二) DQN发展历程(三) DQN发展历程(四) DQN发展历程(五) 动态规划 动态规划给出了求解强化学习的一种方式 使用条件 使用动态规划需要两个条件 总问题可以分解成一系列相互重叠的子问题 子问题的求解结果被存储下来并且可以重复使用 强化学习对应以上两个条件 贝尔曼等式满足了重叠子问题的分解,每个状态的值求解从当前状态到下一状态. 值函数用于存储和复用子问题的求解结果 分类 对于预测问题,动态规划方法输出…
目录 马尔可夫理论 马尔可夫性质 马尔可夫过程(MP) 马尔可夫奖励过程(MRP) 值函数(value function) MRP求解 马尔可夫决策过程(MDP) 效用函数 优化的值函数 贝尔曼等式 参考 DQN发展历程(一) DQN发展历程(二) DQN发展历程(三) DQN发展历程(四) DQN发展历程(五) 马尔可夫理论 马尔可夫性质 P[St+1 | St] = P[St+1 | S1,...,St] 给定当前状态 St ,过去的状态可以不用考虑 当前状态 St 可以代表过去的所有状态…
最近进行了一些国产化相关工作 趁着周末有时间,自己整理一下这段时间的学习内容. 毕竟不是处理器和芯片的业内人士,里面多有纰漏,请谅解. 希望可以作为入门学习的简单知识. 1.0 远古时代 unix 世界CPU的发展历程感觉可以追溯到1970年代的intel的4004 当时世界上还是没有PC这个概念的,都是各个大厂自己生成大型服务器,并且几乎都不兼容. 主要的大厂有IBM.王安电脑.SGI等,像是intel这样的半导体厂商,主要是做内存芯片的,出售给主机厂商. 主机厂商不仅需要研发CPU,还需要制…