DeepSeekMath -- GRPO】的更多相关文章

管道流(线程通信流):管道流的主要作用是可以进行两个线程间的通讯,分为管道输出流(PipedOutputStream).管道输入流(PipedInputStream),如果想要进行管道输出,则必须要把输出流连在输入流之上.如图所示:…
cmder 是一款 windows 下的命令集合软件,它可以集合各种系统下的命令,并且操作非常快速方便.安装有两个版本,一个是简化版(4.27M),一个是完全版(75.7M),它们的唯一区别:完全版包含 git-for-windows,如果你已经装了 git-for-windows,直接下载简化版就好.cmder 没有安装文件,直接下载解压文件,运行 Cmder.exe. 如果我们想 win+r “运行”中输入 cmder 来启动,需要在系统环境变量中添加路径,如下: 添加到右键命令(需要运行管…
RDD :弹性分布式数据集:是一个容错的.并行的数据结构,可以让用户显式地将数据存储到磁盘或内存中,并控制数据的分区   RDD是Spark的核心数据结构,通过RDD的依赖关系形成Spark的调度顺序.所谓Spark应用程序,本质是一组对RDD的操作   RDD的两种创建方式     从文件系统输入(如HDFS)创建     从已存在的RDD转换得到新的RDD   RDD的两种操作算子         Transformation(变换)Transformation类型的算子特点是lazy特性…