python 金融大数据风控建模实战--基于机器学习
王青天 孔越编著, 2020年6月第一版
第一章介绍,介绍金融科技fintech是指使用技术提供财务解决方案。人工智能和机器学习技术可以帮助包括欺诈预防、风险管理、客户服务和营销等多个环节的智能化。个人借贷交易的不同阶段涉及线上借贷行业的9种风险:信用检查不足、中介不充分、还款不及时、流动性不足、缺乏透明度、运营和技术失败、法律风险、过度杠杆和道德缺失,其中信用检查不足风险是最需要控制的风险。
个人信贷中信用风险评估的关键是,通过分析借贷人的信用信息,评估借款人的偿还能力和意愿量化违约风险。信用评分卡模型是个人信贷风险管理中的重要手段。评分卡模型过包括申请评分卡、行为评分卡、催收评分卡,除此之外还有反欺诈模型(无征信前、申请数据、第三方数据)、营销评分卡和客户流失卡等。欺诈行为氛围个人欺诈和团伙欺诈,个人欺诈往往形式各异难以形成普适的规则,只能通过不断积累和总结规则库来进行甄别;对于团伙欺诈啊,需要借助知识图谱技术发现欺诈团伙潜在的关系网,找到异常状态进行甄别。因此,反欺诈模型一般采用基于规则与策略的方法。
接下来讲了评分卡模型的开发流程。
第二章,机器学习介绍
机器学习分为有监督学习、无监督学习和强化学习。
有监督学习分为分类问题(离散)和回归(连续)问题。常见算法有线性回归模型、神经网络模型、支持向量机模型、决策树模型、随机森林、Xgboost模型和深度学习模型等。评分卡模型的开发就是有监督学习,而且是分类问题。
无监督学习的任务一般为聚类分析、降维、关联规则分析。常见聚类:Kmeans、混合高斯模型、DBCAN和AP算法等。线性降维方法:PCA,SVD分解;非线性:KPCA。关联规则分析:Apriori和FP-growth,可以通过关联分析挖掘欺诈数据的特征集,形成反欺诈规则。
强化学习又称增强学习(Reinforcement Learning),是一种特定场景下通过不断试错的方式进行自我更新并学习的方法。
python 金融大数据风控建模实战--基于机器学习的更多相关文章
- 包银消费CTO汤向军:消费金融大数据风控架构与实践
1 业务架构 风控平台是相对独立的系统,信审的案件可以从借款端平台推过来,也可以从第三方平台推过来.信审案件到达风控平台后,自动创建工作流,根据风控流程处理各流程环节任务. •自动决策 风控流程自动处 ...
- 量化派基于Hadoop、Spark、Storm的大数据风控架构--转
原文地址:http://www.csdn.net/article/2015-10-06/2825849 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人 ...
- BAT、网易、京东等如何做大数据风控的?
大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾.区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷. ...
- 【Todo】【读书笔记】大数据Spark企业级实战版 & Scala学习
下了这本<大数据Spark企业级实战版>, 另外还有一本<Spark大数据处理:技术.应用与性能优化(全)> 先看前一篇. 根据书里的前言里面,对于阅读顺序的建议.先看最后的S ...
- Python金融大数据分析PDF
Python金融大数据分析(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1CF2NhbgpMroLhW2sTm7IJQ 提取码:clmt 复制这段内容后打开百度网盘 ...
- Tech 助力Fin ,大数据风控系统赋能掌众金服!
胡亚海 首席技术官 CTO 北京航空航天大学 博士 深耕互联网领域近20年,先后任职于普天信息技术研究院.摩托罗拉.宇龙酷派.百度等知名企业,曾主导宇龙酷派公司全员从WinCE向Android转型 ...
- 个人永久性免费-Excel催化剂功能第98波-零代码零距离轻松接触并拥有金融大数据
数据产生价值的一个最突出的领域-金融领域,股票.证券.上市公司财务报表等,多少人在其中发掘出宝贵的数据价值.今天Excel催化剂联合Tushare金融大数据平台,让这一切的数据都能成为你我普通人零代码 ...
- 《Python金融大数据分析》高清PDF版|百度网盘免费下载|Python数据分析
<Python金融大数据分析>高清PDF版|百度网盘免费下载|Python数据分析 提取码:mfku 内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领 ...
- python金融大数据分析PDF高清完整版免费下载|百度云盘|Python基础教程免费电子书
点击获取提取码:7k4b 内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领域从业人员必读. Python凭借其简单.易读.可扩展性以及拥有巨大而活跃的科学计算社区 ...
- 人物传记Kyle Tedford:数据环境生变,银行大数据风控怎么办?
数据是金融业务的基石,监管集中清查大数据公司,很多东西在发生根本性改变,资金方做"甩手掌柜"的好日子不会重现.那些缺乏自主风控能力的金融机构,在未来的行业竞争中,恐无以立足了.近日 ...
随机推荐
- WebGPU 01之Hello Triangle
1. 引言 WebGPU是什么? WebGPU 到底是什么? - Orillusion的回答 - 知乎 WebGPU与WebGL的对比? WebGL 与 WebGPU 比对 前奏 - 四季留歌 - 博 ...
- Postgresql实现不同用跨模式访问
1.修改参数 2.创建两个用户 创建a1 create user a1 connection limit-1 password '123456'; alter user a1 SUPERUSER; g ...
- 05for循环
for循环 循环的作用与分类 作用:让代码更加高效的重复运行 分类:for循环和while循环 for循环结构 for 临时变量 in 可迭代对象: 重复执行的代码1 重复执行的代码2 ... 可迭代 ...
- MySql创建高性能的索引
创建高性能的索引1.树 减少数据的查询次数二叉树 平衡树 b树 节点存储key和datab+树 节点只存储key 叶子节点存储data innodb使用b+树 当页最大16kb可以存储1000个key ...
- containerd.service containerd-1.6.8-linux-amd64.tar.gz cni-plugins-linux-amd64-v1.1.1.tgz 标准文件下载
配置K8S时 可能会用到#systemcd来管理containerd,这https://raw.githubusercontent.com/containerd/containerd/main/con ...
- 【C学习笔记】day3-2 计算1/1-1/2+1/3-1/4+1/5 …… + 1/99 - 1/100 的值。
#include <stdio.h> int main() { double sum = 0; double j = 1.0; for (int i = 1; i <= 100; i ...
- SAP 开具发票的抬头文本带到会计凭证上
#需求 将开具发票的抬头文本带到会计凭证上.方便财务处理凭证,不然需要再去编辑凭证,容易遗忘. 达到的效果如图所示: #二代增强SDVFX001 事务码cmod分配增强 编写增强出口 代码如下: DA ...
- foreach 和for
"foreach和for循环如果只是遍历集合或者数组,用foreach好些,如果是对集合中的值进行修改,就要用for循环了,其实foreach的内部原理其实也是Iterator,但不能像It ...
- express的使用:web开发(四)
1.开发模式 1.服务端渲染 2.前后端分离 2.身份认证 1.服务端渲染推荐使用session认证机制 2.前端后端分离建议使用JWT认证机制 3.http协议的无状态性 4.cookie特性 1. ...
- DFS略思维题做题记录
洛谷:P4399 [JSOI2008]Blue Mary的职员分配 链接 代码: #include<iostream> using namespace std; int n,x,y,z,A ...