推荐几个来自 MOOCs的 Data Science
数据科学是一个大领域,如果你想成为一个优秀的数据专家,自学是必要的技能。
MOOCs是数据科学的主要来源。有许多网站提供了 MOOCs,比如Coursera、Coursera和Udacity都还不错。无论您的语言是R、python、Java还是c/c++,MOOCs都有涵盖。
如果你是一个初学者,并且了解数据科学到底是什么,或者你成为下一个前沿领域的专家。
这里提供几个公开课列表,您可以根据自己的情况去学习。
关于这些课程资源的一些的指导说明:
你需要考虑到需要的条件,决定所需的学时和持续时间看是否适合自己。
所有的课程是基于你了解统计学的。
课程安排是w.r.t.的专业水平,即初级课程安排在专家级课程前面。
在课程中可能涉及到编程语言,软件工具等。
The Analytics Edge (麻省理工学院)
水平: Beginners-Expert
学时: 10 - 15小时/周
状态: Archived
持续时间: 12周
需要的条件: 无
工具: R
这是用R来学习数据分析的最好课程。课程提供基于一些业务案例的专题和大量的练习。
这个课程对学习时间要求很严格,但是绝对值得。
案例包括《点球成金》、eHarmony、弗雷明汉心脏研究,Twitter,IBM Watson和Netflix。
通过这些例子,我们会教你以下分析方法:线性回归,逻辑回归,各种树、文本分析、集群化、可视化和优化组合。
机器学习 (斯坦福大学)
水平: Beginners-Expert
学时: 7 - 12小时/周
状态: On-demand
持续时间: 11周
需要的条件: 编程
工具: Octave
当你在网络上接触关于机器学习的课程,一定有这个课程视频。它由机器学习领域最好的教授之一Andrew Ng.讲授,完整的课程涵盖了所有机器学习的核心概念。
包括:
(1)监督学习(参数或非参数算法,支持向量机,内核,神经网络)。
(2)无监督学习(集群、降维、推荐系统、深入学习)。
(3) 机器学习的最佳实践(偏差/方差理论,在机器学习和人工智能方面的创新过程)。
数据科学和机器学习要领(微软)
Data Science and Machine Learning Essentials
水平: Beginners-Intermediate
学时: 3 - 4小时/周
状态: On-demand
持续时间: 5周
需要的条件: 无
工具: R
这个课程是MIT专家和微软合作的,帮你学习数据科学以更好地应用于职场。
本课程结束时,你就会知道如何用数据科学和机器学习模型来构建和获得见解。
你将通过Azure 机器学习, R & Python来构建一个云数据解决方案的案例来学习数据采集、准备、探索和可视化方面的关键概念
数据库 (斯坦福大学)
水平: 初学者
学时: 8 - 10小时/周
状态:Self-paced
持续时间: 10周
需要的条件: 无
工具: SQL、XML查询
如果你要处理数据,数据库是不可避免的。
本课程涵盖了数据库设计和数据库管理系统应用程序的使用。
它包括广泛覆盖的关系模型,包含XML数据,DTDs模板、XML模板的内容,同时包含查询和转换语言XPath,Xquery和XSLT的内容。
课程包括UML中的数据库设计,基于依赖关系和正常形式的相关设计原则。
编码矩阵:线性代数在计算机科学的应用 (布朗大学)
Coding the Matrix: Linear Algebra through Computer Science Applications
水平: Beginner-Intermediate
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: Python
线性代数不仅是计算机科学的重要组成,而且机器学习、图形和统计数据都需要。
这是一个杰出的课程,将指导你完成真正的案例和python任务。
你需要编写程序实现基本矩阵和向量的功能和算法,并使用这些实现任务:二维图形变换、脸变形、人脸检测、图像转换、模糊和边缘检测、图像视角移除、分类肿瘤恶性或良性、整数分解、纠错编码和秘密共享。
另一个更基础的课程是德克萨斯奥斯丁大学的LAFF。
学习数据 (加州理工学院)
水平: Intermediate-Expert
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 概率矩阵,微积分
工具: 没有限制
对机器学习爱好者来说这是有史以来最好的公开课。
这是机器的学习入门课程(ML),覆盖基本理论、算法和应用程序,但是需要一个有良好的线性代数,微积分和概率背景以及编程技能。
教授这门课的是Yaser S.Abu-Mostafa ,他是加州理工学院电气工程和计算机科学教授,不仅是亚马逊里机器学习的畅销书的作者,也是一个会简化学习方法的教授。
CSCI E-109 Data Science(哈佛扩展学校)
水平: Beginners-Expert
学时: 7 - 12小时/周
状态: Archived
持续时间: 16周
需要的条件: 无
工具: Python,d3
非常优秀的课程。
本课程介绍五个关键方面的调查方法:
通过data wrangling,清洗和采样得到合适的数据集;
数据管理能够快速、可靠访问大数据;
探索性数据分析生成假说;
基于统计方法如回归和分类来预测;
通过可视化、故事和易理解的总结来和他人沟通。
数据科学概论 (华盛顿大学)
水平: Beginner-Intermediate
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 编程
工具: Python,R,SQL
介绍数据科学的基础知识,通过实践经验从大数据中提取价值。
本课程教你一些数据科学的基本技术,包括SQL和NoSQL大规模数据管理解决方案(例如 MapReduce和时代),数据挖掘算法(如聚类和关联规则挖掘)和基本统计建模(例如线性和非线性回归)。
网络、人群和市场 (康奈尔大学)
水平: Beginners-Expert
学时: 4 - 8小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: 无
这项课程将通过研究社会、经济和技术在世界上是如何连接的基本问题的探索现代生活的相互联系。
学生将探索博弈论,互联网结构,社会传播,社会力量传播的普及,信息瀑布。
链接分析的另一个重要的知识来源是SNAP。
数据分析: Take It to the MAX() (DelftX)
Data Analysis: Take It to the MAX()
水平: Intermediate
学时: 4 - 6小时/周
状态: On-demand
持续时间: 8周
需要的条件:基本的电子表格。
工具: MS-excel,python
即使在大数据时代,有大量的数据分析师还是严重依赖于电子表格收集意见。
对于那些想要使用excel增强分析能力的人这是一个优秀的课程。
你将深入探究电子表格数据分析:数据透视表,VLOOKUPS,Named ranges,what-if分析,并做出图形——这些将在第一周的课程中讲授。
之后,你将学习的电子表格模型的质量,尤其是如何确保您的电子表格保持无差错和强大。
最后,你还需要学习Python编程语言,帮助我们分析和操作电子表格中的数据。
原文来自:Top 20 Data Science MOOCs
推荐几个来自 MOOCs的 Data Science的更多相关文章
- Data Science and Matrix Optimization-课程推荐
课程介绍:Data science is a "concept to unify statistics, data analysis, machine learning and their ...
- data mining,machine learning,AI,data science,data science,business analytics
数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...
- 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系?
本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答 ...
- 学习Data Science/Deep Learning的一些材料
原文发布于我的微信公众号: GeekArtT. 从CFA到如今的Data Science/Deep Learning的学习已经有一年的时间了.期间经历了自我的兴趣.擅长事务的探索和试验,有放弃了的项目 ...
- Introducing DataFrames in Apache Spark for Large Scale Data Science(中英双语)
文章标题 Introducing DataFrames in Apache Spark for Large Scale Data Science 一个用于大规模数据科学的API——DataFrame ...
- 七个用于数据科学(data science)的命令行工具
七个用于数据科学(data science)的命令行工具 数据科学是OSEMN(和 awesome 相同发音),它包括获取(Obtaining).整理(Scrubbing).探索(Exploring) ...
- Data Science at the Command Line学习笔记(一)
学习Data Science at the Command Line时,win7下安装环境是遇到了一些小问题,最后通过百度解决. 官方指导可以在这个地址找到:http://datascienceatt ...
- Data Science 和 Finance 两个领域的融合是什么样子的?
Data Science 和 Finance 两个领域的融合是什么样子的? 2015-05-24 董可人 现在大部分人所说的Quant一般是指各大投行里做衍生品定价,信用评估,风险控制之类工作的人,这 ...
- 【Repost】A Practical Intro to Data Science
Are you a interested in taking a course with us? Learn about our programs or contact us at hello@zip ...
随机推荐
- 插入排序算法&算法分析
- 使用document.domain+iframe跨域实例
首先我们假设主页面地址为:http://www.js8.in/mywork/crossdomain/index.html,我们要加载的内容是位于work.2fool.cn域名下的helloworld. ...
- 用 20 行 python 代码实现人脸识别!
点击上方"Python编程与实战",选择"置顶公众号" 第一时间获取 Python 技术干货! 阅读文本大概需要 11分钟. 今天给大家介绍一个世界上最简洁的人 ...
- OpenGL ES 学习笔记 - Overview - 小旋的博客
移动端图形标准中,目前 OpenGL ES 仍然是比较通用的标准(Vulkan 则是新一代),这里新开一个系列用于记录学习 OpenGL ES 的历程,以便查阅理解. OverView OpenGL ...
- MySQL安装和常用命令
一.安装MySQL groupadd mysqluseradd -r -g mysql mysqlgroups mysqlfind / -name mysql | xargs rm -rfwget h ...
- 让百度和google收录我们的网站
花了几天时间终于把这个看似高大上的博客搞好了,但是发现只能通过在地址栏输入地址进行访问,这很明显和我装X装到底的性格,于是乎在查阅了嘟爷的博客,和我各种百度终于搞出来了. 让谷歌收录 让谷歌收录还是比 ...
- 爬虫cookies详解
cookies简介 cookie是什么? Cookie,有时也用其复数形式 Cookies,指某些网站为了辨别用户身份.进行 session 跟踪而储存在用户本地终端上的数据(通常经过加密).定义于 ...
- 一天速成Python教程
一.Python基础 Python是对象有类型,变量无类型的动态类型语言,追求简单优雅易读.可以在终端中逐行运行,也可以编写成大型的面向对象的工程.在开始写之前,注意Python 2.X中,开头要写上 ...
- Java和C++引用的区别
Java的引用实际上是对指针的一个封装. C++的引用是变量的一个别名. Java的定义出来的变量(除了基本类型)其实就是一个引用,指向真正的对象. C++可以通过将引用传入函数,在函数内修改所引用的 ...
- 《javascript高级程序设计》笔记:文档模式
文档模式是用于指定浏览器使用什么样的标准来正确的显示网页,各个标准的解析存在着差异 文档类型的分类 文档模式大致分为三种类型: 混杂模式(quirks mode) 标准模式(standards mod ...