What is your first plan of action when working on a new competition? 理解竞赛,数据,评价标准. 建立交叉验证集. 制定.更新计划. 检索类似竞赛和相关论文. What does your iteration cycle look like? Sacrifice a couple of submissions in the beginning of the contest to understand the importance…
引言 这段时间来,看了西瓜书.蓝皮书,各种机器学习算法都有所了解,但在实践方面却缺乏相应的锻炼.于是我决定通过Kaggle这个平台来提升一下自己的应用能力,培养自己的数据分析能力. 我个人的计划是先从简单的数据集入手如手写数字识别.泰坦尼克号.房价预测,这些目前已经有丰富且成熟的方案可以参考,之后关注未来就业的方向如计算广告.点击率预测,有合适的时机,再与小伙伴一同参加线上比赛. 数据集 介绍 MNIST ("Modified National Institute of Standards an…
主要是通过mnist了解kaggle的操作细节,最终这里的结果为: 引入必须的库¶ import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.image as mpimg import seaborn as sns #专门用于数据可视化的 %matplotlib inline np.random.seed(2) from sklearn.model_selection im…
Jeremy Howard 在业界可谓大名鼎鼎.他是大数据竞赛平台 Kaggle 的前主席和首席科学家.他本人还是 Kaggle 的冠军选手.他是美国奇点大学(Singularity University)最年轻的教职工.曾于 2014 年,作为全球青年领袖,在达沃斯论坛上发表主题演讲.他在 TED 上的演讲 The wonderful and terrifying implications of computers that can learn 收获高达 200 万的点击.同时,他还创立了 E…