分析工具:

(1)SQL

    select from

    where

    group by having

    order by

    limit

    运算符(算数运算符+-*/、比较运算符><=、逻辑运算符not/and/or)

    聚合函数(count、sum、avg、max、min)

    函数(算术函数、字符串函数、日期函数)

    子查询(标量子查询、关联子查询)

    谓词(like、between、is null、in)

    case when

    集合运算(表的加减法、表联结)

(2)python

    列表/元祖/字典/集合

    if/while/for

    函数/高阶函数

    迭代器/生成器

    类/继承/多态

    numpy

    pands

    matplotlib/seaborn

    scikit-learn

    搜索(二分)

    排序(希尔、归并、快排)

    递归(斐波拉契、回文)

    最优化(背包、动态规划、贪心)

    随机游走

    二叉树

(3)Linux

    Bash shell

理论基础:

(1)统计概率

    条件概率/贝叶斯/极大似然估计/最大后验估计

    概率分布(0-1分布/伯努利分布、二项分布、泊松分布、正态分布/高斯分布、指数分布、β分布、γ分布)

    中心极限定理/大数定律

    假设检验(抽样、区间估计、置信区间、P值)

    方差分析/显著性差异(T检验、F检验)

    蒙特卡罗

    时间序列

(2)机器学习

    代价函数(MSE、交叉熵损失)

    梯度下降(随机梯度、小批量梯度)

    极大似然估计

  交叉验证(gridsearchCV)

    模型评估(R2、RMSE、accuracy、Precision、AUC、ROC、F1 score)

    模型融合(voting、averaging、bagging、boosting、stacking)

  过拟合

    正则化

    预处理(标准化、归一化)

    异常值检测

    特征工程(embedding)

    线性回归(lasso、ridge)

  logistic回归(熵、基尼系数)

  感知机/SVM(凸优化、神经网络)

    决策树/随机森林(ID3、C4.5、CART)

    adaboost/gbdt/xgboost/lightgbm

    朴素贝叶斯

    KNN(kd树)

    k-means

    PCA/SVD

    推荐系统(关联分析Apriori、协同过滤)

(3)大数据

    hadoop原理

    mapreduce原理

业务逻辑:

(1)方法论

    金字塔/逻辑树

   5W2H(whay、what、who、when、where、how、how much)

    pest行业分析(政治、经济、社会、技术)

    4P营销理论(产品、价格、渠道、促销)

    用户行为理论(认知/访问、熟悉/浏览搜索、试用/注册、使用/登录订购、忠诚/黏性流失)

    生命周期理论

(2)分析方法

    对比分析

    漏斗分析

    A/B test

    埋点分析

    来源分析

(3)指标体系

    人(用户画像)

    商品()

    订单(购买行为)

    时间(生命周期)

2019 study list的更多相关文章

  1. 2019 front-end web trending

    2019 front-end web trending https://github.com/kamranahmedse/developer-roadmap https://raw.githubuse ...

  2. 3000字编程入门--附带Java学习路线及视频

    Title: 编程入门 GitHub: BenCoper Reference: 尚硅谷-2019 Study: 文字版+视频+实战(第一个自学的网站) Explain: 文末附带Java学习视频以及项 ...

  3. 42028: Assignment 1 – Autumn 2019

    42028: Assignment 1 – Autumn 2019 Page 1 of 4Faculty of Engineering and Information TechnologySchool ...

  4. Some JPR highlights (JPR 2019 March)

    Journal Name:Journal of Proteome Research Issue:2019 March Shared by: Weining Zhao 1.     Acetylome: ...

  5. zz先睹为快:神经网络顶会ICLR 2019论文热点分析

    先睹为快:神经网络顶会ICLR 2019论文热点分析 - lqfarmer的文章 - 知乎 https://zhuanlan.zhihu.com/p/53011934 作者:lqfarmer链接:ht ...

  6. Deep learning_CNN_Review:A Survey of the Recent Architectures of Deep Convolutional Neural Networks——2019

    CNN综述文章 的翻译 [2019 CVPR] A Survey of the Recent Architectures of Deep Convolutional Neural Networks 翻 ...

  7. China International Industry Fair 2019

    Today i visit the CIIF 2019, as a "professional visitor"  since i have made an appointment ...

  8. 2019年逾期率上升_24家头部P2P平台最新运营数据解读:8家近一年逾期率走势曝光

    python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_ca ...

  9. ICML 2019 分析

    ICML 2019 分析 Word Embeddings Understanding the Origins of Bias in Word Embeddings Popular word embed ...

随机推荐

  1. Code First 2

    在codefirst一中也说了Mapping是实体与数据库的纽带,model通过Mapping映射到数据库,我们可以从数据库的角度来分析?首先是映射到数据库,这个是必须的.数据库里面一般包括表.列.约 ...

  2. mui自定义事件实例

    监听自定义事件(接收页面应用) 添加自定义事件监听操作和标准js事件监听类似,可直接通过window对象添加,如下: window.addEventListener('customEvent',fun ...

  3. ServletContext--HttpServletResponse--web项目执行流程

    一.ServletContext 接口(javax.servlet) 定义:public interface ServletContext 原理:     Tomcat启动的时候,需要识别webapp ...

  4. DataSource--DBCP--C3P0--DBUtils

    一.DataSource 接口(javax.sql)     1.连接池:         由于与数据库连接的创建和销毁非常占用资源,因此提出了连接池技术,用于提升java程序操作数据库的性能;连接池 ...

  5. SQL 中的group by (转载)

    概述 原始表 简单Group By Group By 和 Order By Group By中Select指定的字段限制 Group By All Group By与聚合函数 Having与Where ...

  6. ssh连接github连不上

    连接github报端口22连接不上: 输入命令展示出ssh_config内容后: vim /etc/ssh/ssh_config 或者使用open /etc/ssh/ssh_config命令在文本编辑 ...

  7. UVA 12405 Scarecrow (基础DP)

    题意: 给出一个1*N的矩阵(就是一行的格子),其中部分格子可以有草,部分无草,现在要求放置一些稻草人在某些格子上,每个稻草人可以覆盖3个连续格子,为使得有草的格子都能被覆盖,问最少放置几个稻草人. ...

  8. Nuget~管理自己的包包

    很久很久以前,自己就想有个包包,最近又从网上淘了一个,价格不便宜呢,99块,还是个小腰包,不过作工还算精良,我喜欢的类型,帆布休闲包,可以将我的手机,耳机,水,小烟,小酒,小伞都放里,方便至极,哈哈!

  9. UVA 110020 Efficient Solutions (STL)

    把一个人看出一个二维的点,优势的点就是就原点为左下角,这个点为右上角的矩形,包含除了右上角以外边界,其他任意地方不存在点. 那么所有有优势的点将会形成一条下凹的曲线. 因为可能有重点,用multise ...

  10. Paper: TranE

    论文标题:Translating Embeddings for Modeling Multi-relational Data 标题翻译:多元关系数据翻译嵌入建模 摘要: 考虑多元关系数据的实体和关系在 ...