AI金融知识自学偏量化方向-前提1

前提：

统计学习（统计分析）和机器学习之间的区别
金融公司采用机器学习技术及招募相关人才要求

第一个问题：

　机器学习和统计学都是数据科学的一部分。机器学习中的学习一词表示算法依赖于一些数据（被用作训练集），来调整模型或算法的参数。这包含了许多的技术，比如回归、朴素贝叶斯或监督聚类。但不是所有的技术都适合机器学习。例如有一种统计和数据科学技术就不适合——无监督聚类，该技术是在没有任何先验知识或训练集的情况下检测 cluster 和 cluster 结构，从而帮助分类算法。这种情况需要人来标记 cluster。一些技术是混合的，比如半监督分类。一些模式检测或密度评估技术适合机器学习。

　　数据科学要比机器学习广泛。数据科学中的数据可能并非来自机器或机器处理（调查数据可能就是手动收集，临床试验涉及到专业类型的小数据），就像我刚才所说的，它可能与「学习」没有任何关系。但主要的区别在于数据科学覆盖整个数据处理，并非只是算法的或统计类分支。细说之，数据科学也包括：

　　数据集成（data integration）

　　分布式架构（distributed architecture）

　　自动机器学习（automating machine learning）

　　数据可视化（data visualization）

　　dashboards 和 BI

　　数据工程（data engineering）

　　产品模式中的部署（deployment in production mode）

　　自动的、数据驱动的决策（automated, data-driven decisions）

　　当然，在许多公司内数据科学家只专注这些流程中的一个。

第二个问题：

机器学习有多种衍生方法，其中包括监督学习、无监督学习、深度学习和强化学习等。

对于金融领域而言，监督学习的目的是建立两个数据集之间的关系，并使用一个数据集预测另一个数据集；无监督学习的目的是尝试了解数据的结构，并确定其背后的主要规则；深度学习的目的是使用多层神经网络来分析事物背后的趋势；而强化学习则使用算法来探索和找到最有利可图的交易策略。

监督学习将被用于预测趋势

在财务背景下，摩根大通认为监督学习算法通过历史数据，可以找到规律，对未来进行预测。监督学习算法有两种形式：回归和分类方式。

回归形式的监督学习方法尝试基于输入变量来预测输出。例如：如果通货膨胀速度加快，它可能会判断下一步市场的走向。

分类方法则与之相反，尝试将数据识别到已有类别中。

无监督学习将被用于识别大量变量之间的关系

在无监督学习中，机器被输入了一整套资产组合的回报，同时并不知道其中的关联和独立变量。在高层次上，无监督学习方法被归为聚类或因素分析。

聚类分析基于一些相似性概念将数据集分成较小的组。例如：它可以包含历史数据中高低波动性、经济上升和下降速率或通货膨胀的增减。

因素分析旨在识别数据的主要内在规律或确定数据的最佳表示方法。例如：收益曲线的运动可以被解释为曲线的平行位移、曲线变陡峭或变凸。在复杂资产组合中，因素分析将提炼出数据的主驱动力，如动量、价值、进位、波动或流动性。

深度学习系统将承担起更艰难的任务

深度学习是重现人类大脑智慧的一种方式。摩根大通在报告中认为深度学习特别适合非结构化大数据集的预处理（例如，可应用于分析卫星图像中的汽车、或新闻稿中的情绪）。深度学习模型可以用虚拟财务数据来预测市场修正概率。

深度学习方法基于神经网络，而神经网络是受到人类大脑神经活动的形式而受到启发的。在网络中，每个神经元接收来自其他神经元的输入，并计算这些「神经元」的加权平均值。权重的计算则基于从历史数据中得来的经验。

神经网络的特征指标，其中包括成本函数、优化器、初始化方案、激活函数、正则化方案

强化学习将被用于行动的选择，以最大化收益

强化学习的目标是选择一系列成功的行动以最大化目标（或累积）收益。不同于监督学习（通常只是一步的过程），强化学习模型并不知道每一步的确切行动是什么。摩根大通的电子交易部门已经开发了一些基于强化学习的算法。

你需要成为一位出色的 quant 和出色的程序员

摩根大通说数据科学家应该具备的技能组合基本上和量化研究者差不多。现在有计算机科学、统计学、数学、金融工程学、计量经济学和自然科学背景的买方和卖方 quant 都应该重塑自我。量化交易策略的专业技能将会成为关键。

「比起一位 IT 专家、硅谷企业家或学者学习如何设计一种可行的交易策略，一个 quant 研究者改变数据集的格式/大小并使用更好的统计与机器学习工具可要容易得多。」

摩根大通强调，你并不需要非常详细地洞悉机器学习的方方面面。大多数机器学习方法都有现成的代码：你只需要应用已有的模型即可。

支持部门需要理解大数据

最终，摩根大通注意到支持部门也要包含大数据。报告说到，很多雇主与人事经理都无法明确区别「谈论人工智能的能力」与「设计可交易策略」的能力，合规团队需要能够审查机器学习模型，并保证数据匿名，不包含私人信息。金融领域机器学习时代正在到来。

科技的发展会渗透到人类生活的方方面面，这是毋庸置疑的一点，因此也理所当然地包括了金融投资。无论是程式化交易，还是上文提到的大数据和机器，都是不断进化后的成果。

当我们了解自己的能力有限时，就应该去寻求更好的投资方式。例如战绩出色的经理人和交易程式。

AI金融知识自学偏量化方向-前提1的更多相关文章

AI金融知识自学偏量化方向-目录0
前提: 统计学习(统计分析)和机器学习之间的区别金融公司采用机器学习技术及招募相关人才了解不同类型的机器学习有监督学习 vs 无监督学习迭代和评估偏差方差权衡结合有监督学习和无监督学习(半 ...
AI金融知识自学偏量化方向-了解不同类型的机器学习2
有监督学习 vs 无监督学习迭代和评估偏差方差权衡结合有监督学习和无监督学习(半监督学习)
HTML基础知识自学教程
HTML 是用来描述网页的一套标记标签,是我们在web前端开发中的基础.下面PHP程序员雷雪松主要结合自己的经验给大家分享下HTML的基础知识,以及在自学过程中一些比较常用的和重要的HTML知识点. ...
公司需求知识自学- Hashtable简单应用
定义表 Hashtable tblNames = new Hashtable(); 添加key,value键值对 tblNames.Add("A","a"); ...
公司需求知识自学-Oracle的Package的作用及用法
Oracle的Package的作用简化应用设计.提高应用性能.实现信息隐藏.子程序重载. 1.Oracle的Package除了把存储过程放到一堆儿以外还有没有其他的作用(好处)? 你不觉得把存储过 ...
软件图书，偏.net方向
深入理解计算机系统(原书第2版) 作者:Randal E.Bryant:1981年在麻省理工学院获计算机科学博士学位,现任美国卡内基·梅隆大学计算机学院院长内容: 深入浅出地介绍了处理器.编译器.操 ...
AI金融：LSTM预测股票
第一部分:从RNN到LSTM 1.什么是RNN RNN全称循环神经网络(Recurrent Neural Networks),是用来处理序列数据的.在传统的神经网络模型中,从输入层到隐含层再到输出层, ...
AI金融：利用LSTM预测股票每日最高价
第一部分:从RNN到LSTM 1.什么是RNN RNN全称循环神经网络(Recurrent Neural Networks),是用来处理序列数据的.在传统的神经网络模型中,从输入层到隐含层再到输出层, ...
【转载】如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向？未来几年 AI 泡沫会破裂吗？
原贴地址: https://www.zhihu.com/question/316135639 作为一个 AI 方向的在读博士生,实在是过的蛮闹心,无意中逛知乎发现了这个帖子,发现很适合现在的自己,于是 ...

随机推荐

Python图形编程探索系列-02-框架设计
跳转到我的博客设计任务在主窗口root中放置三个容器用于容纳组件,容器采用框架设计. 代码初步设计 import tkinter as tk root = tk.Tk() root.geometr ...
Java开发环境安装过程
IntelliJ IDEA 安装下载配置代理信息 JDK 安装安装JDK,cmd -> java -version 查看是否有java版本信息安装成功会显示版本信息配置环境变量Path, ...
PHP Web项目开发学习，经验谈
列个表格吧,看着也比较方便: 时间事项六月七月八月九月工作任务前端页面服务端页面地图定位服务器搭建图片上传视频文件信息的获取关键词 Css+div+js PHP,谷歌maps ...
rabbitmq使用（三）
Publish/Subscribe In the previous tutorial we created a work queue. The assumption behind a work que ...
Java开发笔记（九十一）IO流处理简单的数据压缩
前面介绍的文件I/O,不管是写入文本还是写入对象,文件中的数据基本是原来的模样,用记事本之类的文本编辑软件都能浏览个大概.这么存储数据,要说方便确实方便,只是不够经济划算,原因有二:其一,写入的数据可 ...
Celery入门指北
Celery入门指北其实本文就是我看完Celery的官方文档指南的读书笔记.然后由于我的懒,只看完了那些入门指南,原文地址:First Steps with Celery,Next Steps,Us ...
静态代理、JDK动态代理和CGLib动态代理之前的区别
昨天看了一天的代理方面的知识,刚开始看的时候没看出什么花头来,感觉不实用.一大堆的东西,还不如直接new出来,然后调用方法.后来仔细研究了一下AOP(面向切面)的思想,才发现代理的用处实在太大了.现在 ...
C#用WebBrowser与WIN API辅助模拟获取网站完整Cookie
网上找到的可以完整获取Cookie的方法,转载一下希望能帮助更多人. 亲测可用在Winform中使用WebBrowser控件获取网站的Cookie有时候是不完整的,默认调用Document.Cook ...
.Net Core AES加密解密
一.AES说明高级加密标准(英语:Advanced Encryption Standard,缩写:AES),在密码学中又称Rijndael加密法,是美国联邦政府采用的一种区块加密标准.这个标准用来替 ...
AS 自定义 Gradle plugin 插件案例 MD
Markdown版本笔记我的GitHub首页我的博客我的微信我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...

AI金融知识自学偏量化方向-前提1

AI金融知识自学偏量化方向-前提1的更多相关文章

随机推荐

热门专题