python 金融大数据风控建模实战--基于机器学习
王青天 孔越编著, 2020年6月第一版
第一章介绍,介绍金融科技fintech是指使用技术提供财务解决方案。人工智能和机器学习技术可以帮助包括欺诈预防、风险管理、客户服务和营销等多个环节的智能化。个人借贷交易的不同阶段涉及线上借贷行业的9种风险:信用检查不足、中介不充分、还款不及时、流动性不足、缺乏透明度、运营和技术失败、法律风险、过度杠杆和道德缺失,其中信用检查不足风险是最需要控制的风险。
个人信贷中信用风险评估的关键是,通过分析借贷人的信用信息,评估借款人的偿还能力和意愿量化违约风险。信用评分卡模型是个人信贷风险管理中的重要手段。评分卡模型过包括申请评分卡、行为评分卡、催收评分卡,除此之外还有反欺诈模型(无征信前、申请数据、第三方数据)、营销评分卡和客户流失卡等。欺诈行为氛围个人欺诈和团伙欺诈,个人欺诈往往形式各异难以形成普适的规则,只能通过不断积累和总结规则库来进行甄别;对于团伙欺诈啊,需要借助知识图谱技术发现欺诈团伙潜在的关系网,找到异常状态进行甄别。因此,反欺诈模型一般采用基于规则与策略的方法。
接下来讲了评分卡模型的开发流程。
第二章,机器学习介绍
机器学习分为有监督学习、无监督学习和强化学习。
有监督学习分为分类问题(离散)和回归(连续)问题。常见算法有线性回归模型、神经网络模型、支持向量机模型、决策树模型、随机森林、Xgboost模型和深度学习模型等。评分卡模型的开发就是有监督学习,而且是分类问题。
无监督学习的任务一般为聚类分析、降维、关联规则分析。常见聚类:Kmeans、混合高斯模型、DBCAN和AP算法等。线性降维方法:PCA,SVD分解;非线性:KPCA。关联规则分析:Apriori和FP-growth,可以通过关联分析挖掘欺诈数据的特征集,形成反欺诈规则。
强化学习又称增强学习(Reinforcement Learning),是一种特定场景下通过不断试错的方式进行自我更新并学习的方法。
python 金融大数据风控建模实战--基于机器学习的更多相关文章
- 包银消费CTO汤向军:消费金融大数据风控架构与实践
1 业务架构 风控平台是相对独立的系统,信审的案件可以从借款端平台推过来,也可以从第三方平台推过来.信审案件到达风控平台后,自动创建工作流,根据风控流程处理各流程环节任务. •自动决策 风控流程自动处 ...
- 量化派基于Hadoop、Spark、Storm的大数据风控架构--转
原文地址:http://www.csdn.net/article/2015-10-06/2825849 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人 ...
- BAT、网易、京东等如何做大数据风控的?
大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾.区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷. ...
- 【Todo】【读书笔记】大数据Spark企业级实战版 & Scala学习
下了这本<大数据Spark企业级实战版>, 另外还有一本<Spark大数据处理:技术.应用与性能优化(全)> 先看前一篇. 根据书里的前言里面,对于阅读顺序的建议.先看最后的S ...
- Python金融大数据分析PDF
Python金融大数据分析(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1CF2NhbgpMroLhW2sTm7IJQ 提取码:clmt 复制这段内容后打开百度网盘 ...
- Tech 助力Fin ,大数据风控系统赋能掌众金服!
胡亚海 首席技术官 CTO 北京航空航天大学 博士 深耕互联网领域近20年,先后任职于普天信息技术研究院.摩托罗拉.宇龙酷派.百度等知名企业,曾主导宇龙酷派公司全员从WinCE向Android转型 ...
- 个人永久性免费-Excel催化剂功能第98波-零代码零距离轻松接触并拥有金融大数据
数据产生价值的一个最突出的领域-金融领域,股票.证券.上市公司财务报表等,多少人在其中发掘出宝贵的数据价值.今天Excel催化剂联合Tushare金融大数据平台,让这一切的数据都能成为你我普通人零代码 ...
- 《Python金融大数据分析》高清PDF版|百度网盘免费下载|Python数据分析
<Python金融大数据分析>高清PDF版|百度网盘免费下载|Python数据分析 提取码:mfku 内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领 ...
- python金融大数据分析PDF高清完整版免费下载|百度云盘|Python基础教程免费电子书
点击获取提取码:7k4b 内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领域从业人员必读. Python凭借其简单.易读.可扩展性以及拥有巨大而活跃的科学计算社区 ...
- 人物传记Kyle Tedford:数据环境生变,银行大数据风控怎么办?
数据是金融业务的基石,监管集中清查大数据公司,很多东西在发生根本性改变,资金方做"甩手掌柜"的好日子不会重现.那些缺乏自主风控能力的金融机构,在未来的行业竞争中,恐无以立足了.近日 ...
随机推荐
- 基于docker的spark分布式与单线程、多线程wordcount的对比实验
1. 分布式环境搭建 1.1 基于docker的spark配置文件 docker-compose.yml version: '2' services: spark: image: docker.io/ ...
- pat 乙级1024 科学计数法关于stl中size()的一些思考即测试点六,无符号整数问题
来,先看题目:1024 科学计数法 分数 20 作者 HOU, Qiming 单位 浙江大学 科学计数法是科学家用来表示很大或很小的数字的一种方便的方法,其满足正则表达式 [+-][1-9].[0-9 ...
- Spark Streaming实时计算
spark批处理模式: receiver模式:接收数据流,负责数据的存储维护,缺点:数据维护复杂(可靠性,数据积压等),占用计算资源(core,memory被挤占) direct模式:数据源由三方组件 ...
- react 01基础 样式
一,react 特点 1. 声明式设计 2.虚拟dom 3.jsx 4.组件化,模块化 5.单向数据流 二,脚手架 Create React App npm i -g create-react-app ...
- VMware-实用网站
二进制包的获取方式 ftp://ftp.redhat.com推荐网站 www.rpmfind.net相应的官方网站http://www.mysql.com
- mapreduce和yarn集群
mapreduce : 先分再合,分而治之 分布式计算概念: 计算方式,与集中式计算相对.将应用拆分成小的部分,分配给多台计算机处理,mapreduce是分布式的计算框架. MR的特点:易于编程,良好 ...
- 2022-04-26内部群每日三题-清辉PMP
1.一家组织的经验教训数据库表明过去的重大项目问题是质量失败.项目经理在制定质量管理过程时决定做得更彻底.为确保质量,项目经理应该怎么做? A.根据项目的范围和需求制定质量管理计划. B.将所有质量控 ...
- 如何在mac上配置Apache服务器
如何在mac上配置Apache服务器 1. 打开终端,开启Apache: //开启apache: sudo apachectl start //重启apache: sudo apachectl ...
- Software--C#--grammer_Delegate--Event
2018-05-01 10:49:47 委托是一种类型,而事件是一个类或结构的成员,如同字段,属性.必须在类或结构中声明. 引申 - Observe 观察者模式 Publish/Subscribe ...
- vue指令入门
1. vue属性.事件.内容绑定 1 <div id="dv"> 2 <!-- v-cloak能够解决表达式闪烁问题 3 (当网速较慢时,会先出现{{msg}} ...