新的一个月,我要给自己立FLAG了, ABCDEFG HIJKLMN

天下事有难易乎,为之,则难者亦易矣,不为,则易者亦难矣。

这次采取的策略是,每完成一项work回来补充内容。希望能把这篇blog补满!!!

  1. TCG project —— EVIL

    • Using alpha-beta Search (逃~)
    • Using Monte-Carlo Tree Search
      • 如果有时间的话试试看,,不过目前看来 希望不大,现在考虑把TCL加上然后train一个高质量的AI出来
    • NegaMax? NegaScout.. if time is allowed
      • 因为player 和 evil 的策略会有不同,所以不能是用negaMax的形式,不过这些都不是问题,问题是我目前的做法仅仅是在当前状态继续往下搜索一层而已(看哪个branch的得分最小)。
      • 另外,发现一个严重的问题,learning rate非常难把握,0.01,0.001,0.0001甚至更小,但是发现练太久直接导致overfitting,而不知道在什么时候更换learning rate也很蛋疼,,记得一开始练出一个很强的AI把对方限制在2000分,后来越练越烂,对打的时候发现AI已经不会玩了。这个找机会再修改吧。
      • 仅仅使用TD learning还是不够强,虽然我的feature已经足够好了,但是这和使用了TCL(Temporal Coherence Learning)的AI相差很远,找个机会把TCL弄清楚然后加上去。
      • Mastering 2048 with Delayed Temporal Coherence Learning, Multi-State Weight Promotion, Redundant Encoding and Carousel Shaping
        • Jaśkowski, Wojciech. "Mastering $2048 $ with Delayed Temporal Coherence Learning, Multi-State Weight Promotion, Redundant Encoding and Carousel Shaping." arXiv preprint arXiv:1604.05085 (2016).
    • How many ply?
      • 233333
    • Time limited?
  2. Proof number Search
  3. Presentation
    • Dual Lambda Search and Shogi Endgames

      • Lambda Search (single goal)
      • Lambda Search (composite goal)
      • Dual Lambda Search
      • Proof number Search (Depth-First Proof-Number Search)
      • Shogi Endgames
        • 将棋的残局:诘将棋必至,前者是连将杀,特点是每一手都要王手(将军),后者则是更像中国象棋排局那样,不在乎是否每手都要将军,最后封死玉将即可。
        • Check (將軍,則稱為王手(おうて)
        • Checkmate(narrow sense): ( 將死或將殺,簡稱殺)
        • Brinkmate (narrow sense): ( 绝杀,必至 )
      • others?
    • Slide (maybe can use beamer?) using google doc...23333
    • Discuss wih やきねこ & teacher
  4. Unix Network Programming
    • Project 3

      • 目前进度,,搞懂了CGI到底是什么鬼,好象是可以开始写了。23333
      • part1_cgi:
        • Write a CGI program to receive an HTTP request
        • Then, the CGI program connects to the three ras or rwg servers and then redirects the batch file (stored in the HTTP server) as input to these servers.
        • hen receiving messages, send these messages back to the browser as the returning web page. Note that the returning web page includes several columns,one for displaying the returning messages from each server.
      • part2_httpserver:
        • Write a simple http server in Unix to support CGI.
        • This must work with TA's CGI programs (samples will be posted) and the previous CGI you wrote.
      • part3_httpserver+cgi in windows:
        • simple http server which only provides the remote batch service, that is, it is the combination of 1st part and 2nd part.
        • implement Nonblocking by API WASAsyncSelect easily, than implement the corresponding event to each action. Since the program combines HTTP and CGI, it is both server(for browser) and client(for ras/rwg). Thus, you need to define another messege to handle different event.
  5. Seminar
    • Giraffe: Using Deep Reinforcement Learning to Play Chess ?? (next time? not sure)
    • Dancing Links?? puzzles soduko?
  6. 统计学习方法(not sure)
  7. 西瓜书(not sure)
  8. 神书 —— Searching for Solutions in Games and Artificial Intelligence
  9. Chimo
    • UCCI Battle System
  10. Data Mining report

Month Scheme的更多相关文章

  1. SQL Server ->> 生成时间类型的Partition Function和Partition Scheme代码

    有时工作中要建个分区函数,可是像日期这种分区函数要是搞个几百个的值那不是要搞死我.于是写了点代码自动生成一个从1990年开始的按月的分区函数和对应的分区主题 USE [TestDB] GO DECLA ...

  2. Partition:Partiton Scheme是否指定Next Used?

    在SQL Server中,为Partition Scheme多次指定Next Used,不会出错,最后一次指定的FileGroup是Partition Scheme的Next Used,建议,在执行P ...

  3. Android业务组件化之URL Scheme使用

    前言: 最近公司业务发展迅速,单一的项目工程不再适合公司发展需要,所以开始推进公司APP业务组件化,很荣幸自己能够牵头做这件事,经过研究实现组件化的通信方案通过URL Scheme,所以想着现在还是在 ...

  4. iOS - URL Scheme 操作

    推荐JLRoutes路由跳转 NSScanner 在寻找更加灵活的页面跳转和通知,我遇见了JLRoutes,从而学习使用URL Scheme来定义界面入口.以前从来没有使用过,不过很多大厂和流行的框架 ...

  5. This month Calendar

    package fourth;import java.text.DateFormatSymbols;import java.util.*;public class CalendarTest { pub ...

  6. 自定义 URL Scheme 完全指南

    本文由 Migrant 翻译自 The Complete Tutorial on iOS/iPhone Custom URL Schemes,转载请注明出处. 注意: 自从自定义 URL 的引入,本文 ...

  7. JS魔法堂:Data URI Scheme介绍

    一.前言 上周五公司内部的Any Topic Conf.上我和同事们分享了这个主题,有同事说这个有用,有同事说这个没啥用,后来还延伸到网站性能的话题上,大家讨论的激烈程度让我觉得这次选题还不错.本篇先 ...

  8. CSS魔法堂:小结一下Box Model与Positioning Scheme

    前言  对于Box Model和Positioning Scheme中3种定位模式的细节,已经通过以下几篇文章记录了我对其的理解和思考.  <CSS魔法堂:重新认识Box Model.IFC.B ...

  9. Project、Target、Workspace and Scheme

    前言 今天有人问我Target和Project是什么关系?额...学习iOS开发都知道Target和Project的关系.这里我就简单的做了一个总结,而且加入的Scheme和Workspace.如果不 ...

随机推荐

  1. FTP的搭建与虚拟目录作用<之简单讲解>

    操作系统:win7 VS2010编写WebService与在IIS的发布<之简单讲解>中我已经说了IIS安装与使用,不明白的可以跳过去看. 1.添加FTP站点 2. 3. 4. 5. zq ...

  2. 欢迎使用 MWeb

    首先介绍一下 MWeb 是什么,MWeb 是专业的 Markdown 写作.记笔记.静态博客生成软件.MWeb 使用的是 Github Flavored Markdown 语法,在使用 MWeb 前, ...

  3. highlight.js 代码高亮插件

    官网:https://highlightjs.org/ API:http://highlightjs.readthedocs.org/en/latest/api.html 1. 简单使用: <l ...

  4. 一个技术汪的开源梦 —— 基于 .Net Core 的公共组件之 Http 请求客户端

    一个技术汪的开源梦 —— 目录 想必大家在项目开发的时候应该都在程序中调用过自己内部的接口或者使用过第三方提供的接口,咱今天不讨论 REST ,最常用的请求应该就是 GET 和 POST 了,那下面开 ...

  5. Java多线程系列--“JUC锁”04之 公平锁(二)

    概要 前面一章,我们学习了“公平锁”获取锁的详细流程:这里,我们再来看看“公平锁”释放锁的过程.内容包括:参考代码释放公平锁(基于JDK1.7.0_40) “公平锁”的获取过程请参考“Java多线程系 ...

  6. 【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 特殊问题和实战经验(五)

    RAC 特殊问题和实战经验(五) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体 ...

  7. RHEL 本地yum源配置

    1.创建挂载目录 # mkdir -p /media/cdrom   2.挂载对应系统版本的iso光盘镜像文件 # mount -o loop -t iso9660 /opt/rhel-server- ...

  8. 分页插件思想:pc加载更多功能和移动端下拉刷新加载数据

    感觉一个人玩lol也没意思了,玩会手机,看到这个下拉刷新功能就写了这个demo! 这个demo写的比较随意,咱不能当做插件使用,基本思想是没问题的,要用就自己封装吧! 直接上代码分析下吧! 布局: & ...

  9. ASP.NET Core 中文文档 第二章 指南(4.4)添加 Model

    原文:Adding a model 作者:Rick Anderson 翻译:娄宇(Lyrics) 校对:许登洋(Seay).孟帅洋(书缘).姚阿勇(Mr.Yao).夏申斌 在这一节里,你将添加一些类来 ...

  10. 用VS Code写Python程序

    安装python 常见的Linux发行版本中已经安装了python,而且可能不止一个版本,以Ubuntu14.04为例,预装的python有2个版本,分别是2.7.6和3.4.3,python2和py ...