推荐几个来自 MOOCs的 Data Science
数据科学是一个大领域,如果你想成为一个优秀的数据专家,自学是必要的技能。
MOOCs是数据科学的主要来源。有许多网站提供了 MOOCs,比如Coursera、Coursera和Udacity都还不错。无论您的语言是R、python、Java还是c/c++,MOOCs都有涵盖。
如果你是一个初学者,并且了解数据科学到底是什么,或者你成为下一个前沿领域的专家。
这里提供几个公开课列表,您可以根据自己的情况去学习。
关于这些课程资源的一些的指导说明:
你需要考虑到需要的条件,决定所需的学时和持续时间看是否适合自己。
所有的课程是基于你了解统计学的。
课程安排是w.r.t.的专业水平,即初级课程安排在专家级课程前面。
在课程中可能涉及到编程语言,软件工具等。
The Analytics Edge (麻省理工学院)
水平: Beginners-Expert
学时: 10 - 15小时/周
状态: Archived
持续时间: 12周
需要的条件: 无
工具: R
这是用R来学习数据分析的最好课程。课程提供基于一些业务案例的专题和大量的练习。
这个课程对学习时间要求很严格,但是绝对值得。
案例包括《点球成金》、eHarmony、弗雷明汉心脏研究,Twitter,IBM Watson和Netflix。
通过这些例子,我们会教你以下分析方法:线性回归,逻辑回归,各种树、文本分析、集群化、可视化和优化组合。
机器学习 (斯坦福大学)
水平: Beginners-Expert
学时: 7 - 12小时/周
状态: On-demand
持续时间: 11周
需要的条件: 编程
工具: Octave
当你在网络上接触关于机器学习的课程,一定有这个课程视频。它由机器学习领域最好的教授之一Andrew Ng.讲授,完整的课程涵盖了所有机器学习的核心概念。
包括:
(1)监督学习(参数或非参数算法,支持向量机,内核,神经网络)。
(2)无监督学习(集群、降维、推荐系统、深入学习)。
(3) 机器学习的最佳实践(偏差/方差理论,在机器学习和人工智能方面的创新过程)。
数据科学和机器学习要领(微软)
Data Science and Machine Learning Essentials
水平: Beginners-Intermediate
学时: 3 - 4小时/周
状态: On-demand
持续时间: 5周
需要的条件: 无
工具: R
这个课程是MIT专家和微软合作的,帮你学习数据科学以更好地应用于职场。
本课程结束时,你就会知道如何用数据科学和机器学习模型来构建和获得见解。
你将通过Azure 机器学习, R & Python来构建一个云数据解决方案的案例来学习数据采集、准备、探索和可视化方面的关键概念
数据库 (斯坦福大学)
水平: 初学者
学时: 8 - 10小时/周
状态:Self-paced
持续时间: 10周
需要的条件: 无
工具: SQL、XML查询
如果你要处理数据,数据库是不可避免的。
本课程涵盖了数据库设计和数据库管理系统应用程序的使用。
它包括广泛覆盖的关系模型,包含XML数据,DTDs模板、XML模板的内容,同时包含查询和转换语言XPath,Xquery和XSLT的内容。
课程包括UML中的数据库设计,基于依赖关系和正常形式的相关设计原则。
编码矩阵:线性代数在计算机科学的应用 (布朗大学)
Coding the Matrix: Linear Algebra through Computer Science Applications
水平: Beginner-Intermediate
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: Python
线性代数不仅是计算机科学的重要组成,而且机器学习、图形和统计数据都需要。
这是一个杰出的课程,将指导你完成真正的案例和python任务。
你需要编写程序实现基本矩阵和向量的功能和算法,并使用这些实现任务:二维图形变换、脸变形、人脸检测、图像转换、模糊和边缘检测、图像视角移除、分类肿瘤恶性或良性、整数分解、纠错编码和秘密共享。
另一个更基础的课程是德克萨斯奥斯丁大学的LAFF。
学习数据 (加州理工学院)
水平: Intermediate-Expert
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 概率矩阵,微积分
工具: 没有限制
对机器学习爱好者来说这是有史以来最好的公开课。
这是机器的学习入门课程(ML),覆盖基本理论、算法和应用程序,但是需要一个有良好的线性代数,微积分和概率背景以及编程技能。
教授这门课的是Yaser S.Abu-Mostafa ,他是加州理工学院电气工程和计算机科学教授,不仅是亚马逊里机器学习的畅销书的作者,也是一个会简化学习方法的教授。
CSCI E-109 Data Science(哈佛扩展学校)
水平: Beginners-Expert
学时: 7 - 12小时/周
状态: Archived
持续时间: 16周
需要的条件: 无
工具: Python,d3
非常优秀的课程。
本课程介绍五个关键方面的调查方法:
通过data wrangling,清洗和采样得到合适的数据集;
数据管理能够快速、可靠访问大数据;
探索性数据分析生成假说;
基于统计方法如回归和分类来预测;
通过可视化、故事和易理解的总结来和他人沟通。
数据科学概论 (华盛顿大学)
水平: Beginner-Intermediate
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 编程
工具: Python,R,SQL
介绍数据科学的基础知识,通过实践经验从大数据中提取价值。
本课程教你一些数据科学的基本技术,包括SQL和NoSQL大规模数据管理解决方案(例如 MapReduce和时代),数据挖掘算法(如聚类和关联规则挖掘)和基本统计建模(例如线性和非线性回归)。
网络、人群和市场 (康奈尔大学)
水平: Beginners-Expert
学时: 4 - 8小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: 无
这项课程将通过研究社会、经济和技术在世界上是如何连接的基本问题的探索现代生活的相互联系。
学生将探索博弈论,互联网结构,社会传播,社会力量传播的普及,信息瀑布。
链接分析的另一个重要的知识来源是SNAP。
数据分析: Take It to the MAX() (DelftX)
Data Analysis: Take It to the MAX()
水平: Intermediate
学时: 4 - 6小时/周
状态: On-demand
持续时间: 8周
需要的条件:基本的电子表格。
工具: MS-excel,python
即使在大数据时代,有大量的数据分析师还是严重依赖于电子表格收集意见。
对于那些想要使用excel增强分析能力的人这是一个优秀的课程。
你将深入探究电子表格数据分析:数据透视表,VLOOKUPS,Named ranges,what-if分析,并做出图形——这些将在第一周的课程中讲授。
之后,你将学习的电子表格模型的质量,尤其是如何确保您的电子表格保持无差错和强大。
最后,你还需要学习Python编程语言,帮助我们分析和操作电子表格中的数据。
原文来自:Top 20 Data Science MOOCs
推荐几个来自 MOOCs的 Data Science的更多相关文章
- Data Science and Matrix Optimization-课程推荐
课程介绍:Data science is a "concept to unify statistics, data analysis, machine learning and their ...
- data mining,machine learning,AI,data science,data science,business analytics
数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...
- 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系?
本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答 ...
- 学习Data Science/Deep Learning的一些材料
原文发布于我的微信公众号: GeekArtT. 从CFA到如今的Data Science/Deep Learning的学习已经有一年的时间了.期间经历了自我的兴趣.擅长事务的探索和试验,有放弃了的项目 ...
- Introducing DataFrames in Apache Spark for Large Scale Data Science(中英双语)
文章标题 Introducing DataFrames in Apache Spark for Large Scale Data Science 一个用于大规模数据科学的API——DataFrame ...
- 七个用于数据科学(data science)的命令行工具
七个用于数据科学(data science)的命令行工具 数据科学是OSEMN(和 awesome 相同发音),它包括获取(Obtaining).整理(Scrubbing).探索(Exploring) ...
- Data Science at the Command Line学习笔记(一)
学习Data Science at the Command Line时,win7下安装环境是遇到了一些小问题,最后通过百度解决. 官方指导可以在这个地址找到:http://datascienceatt ...
- Data Science 和 Finance 两个领域的融合是什么样子的?
Data Science 和 Finance 两个领域的融合是什么样子的? 2015-05-24 董可人 现在大部分人所说的Quant一般是指各大投行里做衍生品定价,信用评估,风险控制之类工作的人,这 ...
- 【Repost】A Practical Intro to Data Science
Are you a interested in taking a course with us? Learn about our programs or contact us at hello@zip ...
随机推荐
- python对csv读写
1.csv文件读取 with open("C:\\Users\\Administrator\\Desktop\\test.csv", 'r', encoding='utf-8') ...
- 【转】Android Monkey 命令行可用的全部选项
常规 事件 约束限制 调试 原文参见:http://www.douban.com/note/257030384/ 常规 –help 列出简单的用法. -v 命令行的每一个 -v 将增加反馈信息的级别. ...
- 环境安装文档(for Ubuntu)
这个文档的目标是:各位小伙伴通过这个文档,可以在一台全新的 Ubuntu 电脑上搭建平常开发使用的环境,主要包含 Node.js, git 和 编辑器部分. 这是针对 Ubuntu 系统的安装文档,W ...
- Leetcode-Day Three
1002. Find Common Characters Given an array A of strings made only from lowercase letters, return a ...
- dagger2的Qualifier与Scope
Qualifier即Named 当module的@Provides提供相同变量的不同属性时:用于区分把哪一个初始化 Module 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ...
- 关于.net MVC中主视图和分部视图的数据共享遇到的问题
今天在开发web时因为调用到的分部视图需要有个隐藏域.然后因为当我们第一次调用分部视图时,是用 @Html.Partial("DetailDataPart")在主视图里把它嵌进去主 ...
- 通过python脚本读取多台虚机硬件信息
主要通过fabric模块实现 import fabric ''' hosts = [] ,): host = "192.168.75." + str(i) hosts.append ...
- 深度解析互联网大厂面试难题自定义@EnableXX系列
深度解析互联网大厂面试难题自定义@EnableXX系列 其实是一个@Import的设计技巧 创建注解@EnableXX(任何名称注解都行,只是这个名字好一些) XXConfiguration类不能 ...
- android通过NFC开启/关闭NTAG213的密码保护功能
穷遍全网没有资料,最后找到了官方的寄存器文档和StackOverflow上找到了解决方案 首先要用 MifareUltralight 来进行操作,在onNewIntent处先校验返回的tag是否包含了 ...
- 关于HTTP那些事
写这篇文章的原因 记录前端性能优化用到的关键概念 简化大家对HTTP的学习 大家或许面试的时候可以用得到哦 HTTP是什么 Web的应用层协议(超文本传输协议HyperText Transfer Pr ...