Intorduction:

时隔好几个月,我准备重新进入Deep Learning 的领域。昨天和老师聊了很多,之前觉得我做的工作就是排列组合,在水论文,灌水。但老师却说:这也是为将来的研究打基础。 我想是这么个道理,科研这一块,写论文,发论文,画图等等细枝末节的工作都是需要经验积累的,一开始搞个大的,不现实,就算搞出来,其他细节工作没做好,影响整体质量,也白搭。

任何问题都要辩证地看。

之后老师给我讲了他的一个idea,几年前想的,时空序列方向,通过arrange不同时间维度组成tensor进行卷积,想法很新颖,我从未听说过,但据他说跑出来效果不好,可能调参没做好,后面事情就搁置了。我听到这个idea,欣喜若狂,又恍然大悟。这不就是Deep Learning 领域做research 的过程吗?

想出一个你认为绝妙的idea,实验验证- 不断打磨-不断验证 重复进行,最终要么出成果,要么变成垃圾扔掉。

Coding:

现在呢,对这个领域重拾了一些信心。越来越意识到,在Deep Learning 领域做research 重要的不是Idea 而是 Implementing ability. 说白了就是Coding 的能力。

面向对象要会,基本的编程思想得懂。python要学过,至少要看得懂别人的代码,就算看不懂,也得具备查阅资料把它看懂的能力。框架得熟悉(pytorch),这和python是一个道理。其中贯穿始终的是coding style。

我这几个月的coding 经历发现,很多beginner 包括我,写出来的代码都很烂,像上完厕所用过的纸。 根本没有复用性,没有鲁棒性。这一块想提高,一是去看代码规范的书,二是多做实战多看别人的代码,自己敲一遍,learn by doing。

我推荐的学习顺序是,先做实战,学到点皮毛,再去看书。有实践经验再看书,会有恍然大悟,茅塞顿开的感觉,你在实践中学到的规范会在书里以高观点的方式体现,诠释。相反,先看书再实践,就没有这样的效果了。只会云里雾里。

当然这一切都建立在你有一个comprehensive idea of deep learning( machine learning),这一方面推荐Andrew Ng 的课程。

Keep following:

基础都搭建好了,那每天就得follow 最新的资讯,看看title,abstract,实在懒看看图片也好。总之,follow领域内的热点,看看大家都在干什么。这一步能create new idea,也能enhance 对一些概念的理解,

看到好的文章,甚至能提升你的维度,以更高的观点俯视问题。这方面需要关注一些AI自媒体,我推荐的:@爱可可老师,机器之心等等。这些都能在一些网站上找到:国内有微博、微信公众号、知乎....国外就是reddit, twitter, medium......

Idea:

他们都说Idea是这个领域最不值钱的东西了,现在人人都有idea,就看谁能最快实现出来。所以我反复强调coding 能力,定期去跑跑demo 实现一个implementation有益科研之路。更何况coding是每个学计算机的人的看家本事,不论将来从事的方向如何,coding都是基本技能,在一个领域内锻炼出来的coding能力换一个领域也同样适用。即使换方向,你的学习速度也会比别人快很多。这大概就是transfer learning?

关于idea,有一篇文章写的相当 informative.我还没看完,但前几章让我受益匪浅。我意识到,好的idea也是排列组合,只不过他们站在更高,更深的维度上发现的。而不断挖掘深度,是我们一以贯之的使命。

如何在计算机应用领域寻找研究想法 - 钱志云的文章 - 知乎 https://zhuanlan.zhihu.com/p/341685279

计算机教授@加州大学河滨分校

Help:

学会寻求帮助,前提是保持humble。coding上,理论上总有牛人,他们懂的比你多,理解的深度比你深,他们的work会惊掉你的下巴。和他们学习,遇到问题向他们寻求帮助。我所认识的绝大多数人都很nice,不会嫌弃你的问题。我最开始做的时候,需要复现一段代码,当时代码跑不通,我去调,coding上遇到了好多问题,就是一位学长不停的指导我,恶补了很多知识,学到很多技巧,有时问他这段代码应该怎么写,他直接把代码敲好发我。其次应该多找老师帮忙,前提是老师人很好。一些研究上的事,一些郁闷的事情,都能和老师交流。我是间隔了快一个学期才去找老师聊聊,聊完后豁然开朗。后悔没有找点找他。当然了,和nice的人交往,自己也要足够nice。这一点至关重要。

最后一段话是写给自己的。出国只看重绩点,而在这个学校,等到考试周抱佛脚,也能有个不错的成绩。学校不卷,绩点不难刷。因此你有大把的时间来做其他事情。你的退路有很多。科研是你的一个爱好,和运动、弹吉他一般,但略高于他们。你会面临更大的困难,要付出更多的时间,精力。做研究不像上课,你面对的是未知的深渊,没有正确答案,没有人懂你的研究内容,你没有同学可以交流讨论。结果的正确性只能靠实验结果验证。突然有一天你脑袋里冒出一个你认为绝妙的idea,你为这个理论想到了完美的解释,根据你的解释,模型一定会work的非常好,经过几个月的实验验证,你怎么都调不好,performance越来越差,你会自我怀疑,妄自菲薄。习惯他,推倒重来。你舍不得,不甘心。但没有用。深渊没有感情,错了就得放弃。

但行好事,莫问前程。做pure researcher~

idea the content of cognition; the main thing you are thinking about More (Definitions, Synonyms, Translation)

Deep Learn I'm back.的更多相关文章

  1. What are some good books/papers for learning deep learning?

    What's the most effective way to get started with deep learning?       29 Answers     Yoshua Bengio, ...

  2. 论文翻译:2021_Towards model compression for deep learning based speech enhancement

    论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...

  3. TensorFlow入门学习(让机器/算法帮助我们作出选择)

    catalogue . 个人理解 . 基本使用 . MNIST(multiclass classification)入门 . 深入MNIST . 卷积神经网络:CIFAR- 数据集分类 . 单词的向量 ...

  4. ubuntu17.10 安装CUDA

    1. 更新apt-get源列表 sudo apt-get update sudo apt-get upgrade 2. 添加驱动源 sudo add-apt-repository ppa:graphi ...

  5. keras_训练人脸识别模型心得

    keras_cnn_实现人脸训练分类 废话不多扯,直接进入正题吧!今天在训练自己分割出来的图片,感觉效果挺不错的,所以在这分享一下心得,望入门的同孩采纳. 1.首先使用python OpenCV库里面 ...

  6. cvpr2015papers

    @http://www-cs-faculty.stanford.edu/people/karpathy/cvpr2015papers/ CVPR 2015 papers (in nicer forma ...

  7. 论文笔记:Learning how to Active Learn: A Deep Reinforcement Learning Approach

    Learning how to Active Learn: A Deep Reinforcement Learning Approach 2018-03-11 12:56:04 1. Introduc ...

  8. Deep learning:五十一(CNN的反向求导及练习)

    前言: CNN作为DL中最成功的模型之一,有必要对其更进一步研究它.虽然在前面的博文Stacked CNN简单介绍中有大概介绍过CNN的使用,不过那是有个前提的:CNN中的参数必须已提前学习好.而本文 ...

  9. 【深度学习Deep Learning】资料大全

    最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron C ...

随机推荐

  1. java多线程之消费生产模型-使用synchronized解决虚假唤醒

    package com.wenshao.juc; /** * 生产者和消费者案例 * * @author Administrator * */ public class TestProductorAn ...

  2. Java 设计模式 —— 组合模式

    在现实生活中,存在很多"部分-整体"的关系,例如,大学中的部门与学院.总公司中的部门与分公司.学习用品中的书与书包.生活用品中的衣服与衣柜.以及厨房中的锅碗瓢盆等.在软件开发中也是 ...

  3. Fastjson 1.2.47 远程命令执行漏洞复现

    前言 这个漏洞出来有一段时间了,有人一直复现不成功来问我,就自己复现了下,顺便简单记录下这个漏洞原理,以便后面回忆. 复现过程 网上已经有很多文章了,这里就不在写了.主要记录一下复现过程中遇到的问题 ...

  4. 初始化CentOS7

    安装CentOS7 配置网络 # 修改网络配置 vi /etc/sysconfig/network-scripts/ifcfg-ens33 TYPE="Ethernet" PROX ...

  5. 解决idea 中web项目无法正常显示的问题

  6. 移动端 CSS3动画属性

    一.transform 转换属性 #1. translate位移 transform : translate(50px,100px); //把元素水平移动 50 像素,垂直移动 100 像素 tran ...

  7. Nessus<强大的漏扫工具>

    刷漏洞,抓鸡必备,,,,,,, 参考文章: https://blog.csdn.net/wwl012345/article/details/96998187 肝,,,,太全了,,, ps : 我不是脚 ...

  8. Vue 打包部署上线

    1,VUE逻辑编写完成后在当前项目下打包 npm run build 需要注意的是,当打包完毕后,需要将入口的index.html的项目dist路径改成相对路径 另外需要注意的一点是,一旦打包vue. ...

  9. day020|python之面向对象基础2

    面向对象基础2 目录 面向对象基础2 7 对象与类型 7.1 类即类型 7.1.1 变量的三个指标 7.1.2 变量类型 7.2 list.append()方法原理 8 对象的高度整合 8.1 通过面 ...

  10. Pygal之掷骰子

    python之使用pygal模拟掷骰子创建直方图: 1,文件die.py,源码如下: 1 from random import randint 2 3 class Die(): 4 '''表示一个骰子 ...