推荐几个来自 MOOCs的 Data Science
数据科学是一个大领域,如果你想成为一个优秀的数据专家,自学是必要的技能。
MOOCs是数据科学的主要来源。有许多网站提供了 MOOCs,比如Coursera、Coursera和Udacity都还不错。无论您的语言是R、python、Java还是c/c++,MOOCs都有涵盖。
如果你是一个初学者,并且了解数据科学到底是什么,或者你成为下一个前沿领域的专家。
这里提供几个公开课列表,您可以根据自己的情况去学习。
关于这些课程资源的一些的指导说明:
你需要考虑到需要的条件,决定所需的学时和持续时间看是否适合自己。
所有的课程是基于你了解统计学的。
课程安排是w.r.t.的专业水平,即初级课程安排在专家级课程前面。
在课程中可能涉及到编程语言,软件工具等。
The Analytics Edge (麻省理工学院)
水平: Beginners-Expert
学时: 10 - 15小时/周
状态: Archived
持续时间: 12周
需要的条件: 无
工具: R
这是用R来学习数据分析的最好课程。课程提供基于一些业务案例的专题和大量的练习。
这个课程对学习时间要求很严格,但是绝对值得。
案例包括《点球成金》、eHarmony、弗雷明汉心脏研究,Twitter,IBM Watson和Netflix。
通过这些例子,我们会教你以下分析方法:线性回归,逻辑回归,各种树、文本分析、集群化、可视化和优化组合。
机器学习 (斯坦福大学)
水平: Beginners-Expert
学时: 7 - 12小时/周
状态: On-demand
持续时间: 11周
需要的条件: 编程
工具: Octave
当你在网络上接触关于机器学习的课程,一定有这个课程视频。它由机器学习领域最好的教授之一Andrew Ng.讲授,完整的课程涵盖了所有机器学习的核心概念。
包括:
(1)监督学习(参数或非参数算法,支持向量机,内核,神经网络)。
(2)无监督学习(集群、降维、推荐系统、深入学习)。
(3) 机器学习的最佳实践(偏差/方差理论,在机器学习和人工智能方面的创新过程)。
数据科学和机器学习要领(微软)
Data Science and Machine Learning Essentials
水平: Beginners-Intermediate
学时: 3 - 4小时/周
状态: On-demand
持续时间: 5周
需要的条件: 无
工具: R
这个课程是MIT专家和微软合作的,帮你学习数据科学以更好地应用于职场。
本课程结束时,你就会知道如何用数据科学和机器学习模型来构建和获得见解。
你将通过Azure 机器学习, R & Python来构建一个云数据解决方案的案例来学习数据采集、准备、探索和可视化方面的关键概念
数据库 (斯坦福大学)
水平: 初学者
学时: 8 - 10小时/周
状态:Self-paced
持续时间: 10周
需要的条件: 无
工具: SQL、XML查询
如果你要处理数据,数据库是不可避免的。
本课程涵盖了数据库设计和数据库管理系统应用程序的使用。
它包括广泛覆盖的关系模型,包含XML数据,DTDs模板、XML模板的内容,同时包含查询和转换语言XPath,Xquery和XSLT的内容。
课程包括UML中的数据库设计,基于依赖关系和正常形式的相关设计原则。
编码矩阵:线性代数在计算机科学的应用 (布朗大学)
Coding the Matrix: Linear Algebra through Computer Science Applications
水平: Beginner-Intermediate
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: Python
线性代数不仅是计算机科学的重要组成,而且机器学习、图形和统计数据都需要。
这是一个杰出的课程,将指导你完成真正的案例和python任务。
你需要编写程序实现基本矩阵和向量的功能和算法,并使用这些实现任务:二维图形变换、脸变形、人脸检测、图像转换、模糊和边缘检测、图像视角移除、分类肿瘤恶性或良性、整数分解、纠错编码和秘密共享。
另一个更基础的课程是德克萨斯奥斯丁大学的LAFF。
学习数据 (加州理工学院)
水平: Intermediate-Expert
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 概率矩阵,微积分
工具: 没有限制
对机器学习爱好者来说这是有史以来最好的公开课。
这是机器的学习入门课程(ML),覆盖基本理论、算法和应用程序,但是需要一个有良好的线性代数,微积分和概率背景以及编程技能。
教授这门课的是Yaser S.Abu-Mostafa ,他是加州理工学院电气工程和计算机科学教授,不仅是亚马逊里机器学习的畅销书的作者,也是一个会简化学习方法的教授。
CSCI E-109 Data Science(哈佛扩展学校)
水平: Beginners-Expert
学时: 7 - 12小时/周
状态: Archived
持续时间: 16周
需要的条件: 无
工具: Python,d3
非常优秀的课程。
本课程介绍五个关键方面的调查方法:
通过data wrangling,清洗和采样得到合适的数据集;
数据管理能够快速、可靠访问大数据;
探索性数据分析生成假说;
基于统计方法如回归和分类来预测;
通过可视化、故事和易理解的总结来和他人沟通。
数据科学概论 (华盛顿大学)
水平: Beginner-Intermediate
学时: 10 - 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 编程
工具: Python,R,SQL
介绍数据科学的基础知识,通过实践经验从大数据中提取价值。
本课程教你一些数据科学的基本技术,包括SQL和NoSQL大规模数据管理解决方案(例如 MapReduce和时代),数据挖掘算法(如聚类和关联规则挖掘)和基本统计建模(例如线性和非线性回归)。
网络、人群和市场 (康奈尔大学)
水平: Beginners-Expert
学时: 4 - 8小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: 无
这项课程将通过研究社会、经济和技术在世界上是如何连接的基本问题的探索现代生活的相互联系。
学生将探索博弈论,互联网结构,社会传播,社会力量传播的普及,信息瀑布。
链接分析的另一个重要的知识来源是SNAP。
数据分析: Take It to the MAX() (DelftX)
Data Analysis: Take It to the MAX()
水平: Intermediate
学时: 4 - 6小时/周
状态: On-demand
持续时间: 8周
需要的条件:基本的电子表格。
工具: MS-excel,python
即使在大数据时代,有大量的数据分析师还是严重依赖于电子表格收集意见。
对于那些想要使用excel增强分析能力的人这是一个优秀的课程。
你将深入探究电子表格数据分析:数据透视表,VLOOKUPS,Named ranges,what-if分析,并做出图形——这些将在第一周的课程中讲授。
之后,你将学习的电子表格模型的质量,尤其是如何确保您的电子表格保持无差错和强大。
最后,你还需要学习Python编程语言,帮助我们分析和操作电子表格中的数据。
原文来自:Top 20 Data Science MOOCs
推荐几个来自 MOOCs的 Data Science的更多相关文章
- Data Science and Matrix Optimization-课程推荐
课程介绍:Data science is a "concept to unify statistics, data analysis, machine learning and their ...
- data mining,machine learning,AI,data science,data science,business analytics
数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...
- 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系?
本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答 ...
- 学习Data Science/Deep Learning的一些材料
原文发布于我的微信公众号: GeekArtT. 从CFA到如今的Data Science/Deep Learning的学习已经有一年的时间了.期间经历了自我的兴趣.擅长事务的探索和试验,有放弃了的项目 ...
- Introducing DataFrames in Apache Spark for Large Scale Data Science(中英双语)
文章标题 Introducing DataFrames in Apache Spark for Large Scale Data Science 一个用于大规模数据科学的API——DataFrame ...
- 七个用于数据科学(data science)的命令行工具
七个用于数据科学(data science)的命令行工具 数据科学是OSEMN(和 awesome 相同发音),它包括获取(Obtaining).整理(Scrubbing).探索(Exploring) ...
- Data Science at the Command Line学习笔记(一)
学习Data Science at the Command Line时,win7下安装环境是遇到了一些小问题,最后通过百度解决. 官方指导可以在这个地址找到:http://datascienceatt ...
- Data Science 和 Finance 两个领域的融合是什么样子的?
Data Science 和 Finance 两个领域的融合是什么样子的? 2015-05-24 董可人 现在大部分人所说的Quant一般是指各大投行里做衍生品定价,信用评估,风险控制之类工作的人,这 ...
- 【Repost】A Practical Intro to Data Science
Are you a interested in taking a course with us? Learn about our programs or contact us at hello@zip ...
随机推荐
- python 堡垒机讲解及实例
paramiko模块,该模块基于SSH用于连接远程服务器并执行相关操作. SSHClient:用于连接远程服务器并执行基本命令 #coding:utf-8 import paramiko ssh=pa ...
- 从0开始学正则表达式-基于python
关于正则表达式,当我们了解它就不难,不了解就很难,其实任何事情都是这样,没有人一生下来就啥都会,说白了,每个人都是一个学习了解进步的过程.学习和掌握正则表达式可能并不是太简单,因为它确实是有点像“外星 ...
- 查漏补缺:socket编程:TCP粘包问题和常用解决方案(上)
1.TCP粘包问题的产生(发送端) 由于TCP协议是基于字节流并且无边界的传输协议,因此很容易产生粘包问题.TCP的粘包可能发生在发送端,也可能发生在接收端.发送端的粘包是TCP协议本身引起的,TCP ...
- 查漏补缺:QT入门
1.什么世QT Qt是一个跨平台的C++图形用户界面应用程序框架,为应用程序开发者提供建立艺术级图形界面所需的所有功能.它是完全面向对象的,容易扩展,并且允许真正的组建编程. 2.支持平台 Windo ...
- iOS多线程之Thread
多线程 • Thread 是苹果官方提供的,简单已用,可以直接操作线程对象.不过需要程序员自己管理线程的生命周期,主要是创建那部分 优缺点 面向对象,简单易用 直接操作线程对象 需要自己管理线程生命周 ...
- python通用读取vcf文件的类(可以直接复制粘贴使用)
前言 处理vcf文件的时候,需要多种切割,正则匹配,如果要自己写其实会比较麻烦,并且每次还得根据vcf文件格式或者需要读取的值不同要修改相应的代码.因此很多人会选择一些python的vcf的库,但 ...
- C++走向远洋——32(项目一内全部成员函数)
*/ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:fenshu.cpp * 作者:常轩 * 微信公众号:World ...
- 2——PHP defined()函数
*/ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:text.cpp * 作者:常轩 * 微信公众号:Worldhe ...
- RTL8812AU双频无线网卡在ubuntu19和20上的驱动安装
旧爱已去 疫情在家,突然邻居敲门说,我这网上不了,帮下忙呗兄弟:兄弟都叫了,哥就冒回险,口罩扎起,一顿xxxx,原来是路由器没插到wlan口,看他拉网线可怜,就把我台式机上无线网卡送给他了,这就是又送 ...
- linux入门系列17--邮件系统之Postfix和Dovecot
前文演示了通过Samba和NFS实现文件共享,本篇演示使用Postfix和Dovecot在局域网实现电子邮件收发系统. 电子邮件系统是我们日常生活和工作中非常重要的一个网络服务,在windows下收发 ...