Data science - Wikipedia

  • https://en.wikipedia.org/wiki/Data_science
  • Data science, also known as data-driven science, is an interdisciplinary field of scientific methods, processes, algorithms and systems to extract knowledge or insights from data in various forms, either structured or unstructured, similar to data mining.

数据学和数据科学_百度百科

  • https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%AD%A6%E5%92%8C%E6%95%B0%E6%8D%AE%E7%A7%91%E5%AD%A6/3565373?fr=aladdin
  • 数据学(Dataology)和数据科学(DataScience)是关于数据的科学,定义为研究探索Cyberspace中数据界奥秘的理论、方法和技术。
  • 主要有两个内涵:一个是研究数据本身;另一个是为自然科学和社会科学研究提供一种新方法,称为科学研究的数据方法。

什么是数据科学?数据科学的基本内容 - CSDN博客

  • https://blog.csdn.net/op07p6aaqo9u71/article/details/78373737
  • 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都充满了数据,这些数据的类型多种多样,不仅包括传统的结构化数据,也包括网页、文本、图像、视频、语音等非结构化数据。数据分析本质上都是在解反问题,而且通常是随机模型的反问题,因此对它们的研究有很多共性。例如,自然语言处理和生物大分子模型都用到隐马尔科夫过程和动态规划方法,其最根本的原因是它们处理的都是一维随机信号;再如,图像处理和统计学习中都用到的正则化方法,也是处理反问题的数学模型中最常用的一种。
  • 数据科学主要包括两个方面:用数据的方法研究科学和用科学的方法研究数据。前者包括生物信息学、天体信息学、数字地球等领域;后者包括统计学、机器学习、数据挖掘、数据库等领域。这些学科都是数据科学的重要组成部分,只有把它们有机地整合在一起,才能形成整个数据科学的全貌。

学习笔记之入行数据科学,这些书一定要看 - 浩然119 - 博客园

  • https://www.cnblogs.com/pegasus923/p/9591291.html
  • https://mp.weixin.qq.com/s/m_HyN47zsBsfW84Y5HjNFg
  • https://anvaka.github.io/greview/hands-on-ml/1/

Python数据科学超强阵容书单 - Python编程

  • https://mp.weixin.qq.com/s/gmaCGWzF3KzX3hmTlua2Zw
  • 1. 为什么数据科学青睐 Python?
  • 2. 那么,简单回顾一下常用的 Python 库。
    • 核心库

      • NumPy
      • Pandas
      • SciPy
    • 绘图以及可视化
      • Matplotlib
      • Seaborn
    • 机器学习
      • Scikit-Learn
      • TensorFlow
  • 3. 数据科学三剑客
    • 《Python数据科学手册》
    • 《数据科学入门》
    • 《数据科学实战》

数据科学 20 个最好的 Python 库 - 数据分析与开发

  • https://mp.weixin.qq.com/s/x2Zk-O7oeFvqmSw0QMqc8w
  • 核心库和统计数据
    • 1. NumPy (Commits: 17911, Contributors: 641)
    • 2. SciPy (Commits: 19150, Contributors: 608)
    • 3. Pandas (Commits: 17144, Contributors: 1165)
    • 4. StatsModels (Commits: 10067, Contributors: 153)
  • 可视化
    • 5. Matplotlib (Commits: 25747, Contributors: 725)
    • 6. Seaborn (Commits: 2044, Contributors: 83)
    • 7. Plotly (Commits: 2906, Contributors: 48)
    • 8. Bokeh (Commits: 16983, Contributors: 294)
    • 9. Pydot (Commits: 169, Contributors: 12)
  • 机器学习
    • 10. Scikit-learn (Commits: 22753, Contributors: 1084)
    • 11. XGBoost / LightGBM / CatBoost (Commits: 3277 / 1083 / 1509, Contributors: 280 / 79 / 61)
    • 12. Eli5 (Commits: 922, Contributors: 6)
  • 深度学习
    • 13. TensorFlow (Commits: 33339, Contributors: 1469)
    • 14. PyTorch (Commits: 11306, Contributors: 635)
    • 15. Keras (Commits: 4539, Contributors: 671)
  • 分布式深度学习
    • 16. Dist-keras / elephas / spark-deep-learning (Commits: 1125 / 170 / 67, Contributors: 5 / 13 / 11)
  • 自然语言处理
    • 17. NLTK (Commits: 13041, Contributors: 236)
    • 18. SpaCy (Commits: 8623, Contributors: 215)
    • 19. Gensim (Commits: 3603, Contributors: 273)
  • 数据采集
    • 20. Scrapy (Commits: 6625, Contributors: 281)

数据科学中必须熟知的5种聚类算法 - 机器学习算法与自然语言处理

  • https://mp.weixin.qq.com/s/6jfE2kAjjeSXTS1US7_ktw
  • 聚类算法是机器学习中涉及对数据进行分组的一种算法,本文详尽的介绍了5种常用的聚类算法。

Command Line Tricks For Data Scientists - 人工智能爱好者社区

  • https://mp.weixin.qq.com/s/B-7ORQDBXAf0YlZhaBTIUQ
  • https://www.oschina.net/translate/cli-4-ds
  • https://kadekillary.work/post/cli-4-ds/

学习笔记之Data Science的更多相关文章

  1. 学习笔记之Data analysis

    Data analysis - Wikipedia https://en.wikipedia.org/wiki/Data_analysis Data analysis is a process of ...

  2. 学习笔记之Data Visualization

    Data visualization - Wikipedia https://en.wikipedia.org/wiki/Data_visualization Data visualization o ...

  3. EnterpriseLibrary 6.0(微软企业库6.0学习笔记) 之Data Access Block 配置和获取链接字符串

    EnterpriseLibrary 的特点是快速开发,融合了微软工程师多年的经验,现在在微软内部有专门的一个小组在完善EnterpriseLibray,最近的更新时间是April 2013. 相关链接 ...

  4. 20. Extjs学习笔记——Ext.data.JsonStore使用说明

    Ext.data.JsonStore继承于Ext.data.Store,使得从远程JSON数据创建stores更为方便的简单辅助类.JsonStore合成了Ext.data.HttpProxy与Ext ...

  5. Extjs学习笔记——Ext.data.JsonStore使用说明

    Ext.data.JsonStore继承于Ext.data.Store.使得从远程JSON数据创建stores更为方便的简单辅助类. JsonStore合成了Ext.data.HttpProxy与Ex ...

  6. Data Science at the Command Line学习笔记(一)

    学习Data Science at the Command Line时,win7下安装环境是遇到了一些小问题,最后通过百度解决. 官方指导可以在这个地址找到:http://datascienceatt ...

  7. 学习笔记之Intermediate Python for Data Science | DataCamp

    Intermediate Python for Data Science | DataCamp https://www.datacamp.com/courses/intermediate-python ...

  8. 学习Data Science/Deep Learning的一些材料

    原文发布于我的微信公众号: GeekArtT. 从CFA到如今的Data Science/Deep Learning的学习已经有一年的时间了.期间经历了自我的兴趣.擅长事务的探索和试验,有放弃了的项目 ...

  9. Comprehensive learning path – Data Science in Python深入学习路径-使用python数据中学习

    http://blog.csdn.net/pipisorry/article/details/44245575 关于怎么学习python,并将python用于数据科学.数据分析.机器学习中的一篇非常好 ...

随机推荐

  1. T-SQL 基础

    什么是T-SQL语言? T-SQL语言是SQL语言的扩展和增强,是与SQL server交流沟通的语言之一. T-SQL的组成部分,数据定义语言-DDL(对数据库对象的创建和管理),数据控制语言-DC ...

  2. 两道dp

    链接:https://ac.nowcoder.com/acm/contest/186/C?&headNav=www 来源:牛客网终于Alice走出了大魔王的陷阱,可是现在傻傻的她忘了带武器了, ...

  3. 20165313 《Java程序设计》第二周学习总结

    教材学习总结 这周我主要学习了教材上的二,三两章.其基本内容就是数据与语句的表达与基本的运用.其中重点要理解并掌握的是: 1.Scanner的运用:利用该类创建对象就可以完成要求用户输入这一要求.类似 ...

  4. THML文档布局元素

    学习要点:     1.文档元素总汇     2.文档元素解析 一.文档元素总汇     文档元素基本没有什么实际作用效果,主要目的是在页面布局时区分各个主题和概念.         元素名称     ...

  5. Maven命令安装jar包到本地仓库

    https://blog.csdn.net/moxiong3212/article/details/78767480 当需要的jar包在中央仓库找不到或者是想把自己生成的jar包放到的Maven仓库中 ...

  6. day39KNN算法和其他的算法

    PS: 1.现在明白为什么其他的同学一直都在做数字图像处理,matlab这种东西了,因为机器学习,其他底层主要是做预先处理,然后调用某一个算法 2.感觉knn算法就是根据先验数据计算下一个跟自己一样不 ...

  7. LED硬件访问服务(2)——JNI/HAL

    一.系统编程 1.SystemServer.java类中提供了main()方法,说明它是以一个进程的方式存在的,启动后直接执行其run() 2.注册服务ServiceManager.addServic ...

  8. react-static 基于react 渐进式静态站点生成框架

    react-static 是一个不错的基于react 开发的静态站点生成框架,可以用来替代create-react-app 包含的特性 100% react 很快的构建以及性能 自动代码以及数据分离 ...

  9. 使用 --image-repository 解决kubeadm 安装k8s 集群 谷歌镜像墙的问题

    从网上我们看到的好多kubeadm 安装k8s 的时候都说需要下拉取镜像,然后修改,实际上 我们可以使用配置参数,快速的跳过墙的问题 说明: 基础镜像,我们仍然存在,拉取的问题,但是dockerhub ...

  10. Windows2008R2系统运行时间超过497天的bug

    早上接到客户电话,说一台测试服务器tomcat服务无法访问,登录服务器查看tomcat连接数据库故障. 使用plsql develop工具登录,提示 ora-12560 TNS:protocol ad ...