Hadoop数据分析实例:P2P借款人信用风险实时监控模型设计
Hadoop数据分析实例:P2P借款人信用风险实时监控模型设计
一提到hadoop相信熟悉IT领域或者经常关注互联网新闻的朋友都应该很熟悉了,当然,这种熟悉可能也只是听着名字耳熟,但并不知道它具体是什么东西,或者用来做什么。这些都不重要,重要的是你知道有hadoop这么个东西就可以了。
前段时间码了一些hadoop方面的分享文章,纯属个人的一点小经验,可能有的地方写的不好,将就下吧!今天要分享的这篇是转载的一篇大快搜索公众号上的文章,是关于时下比较热闹的P2P金融方面对hadoop应用的一个架构设计。

以下为原文:
P2P网络贷款(“peer-to-peer”)为中小企业和个人提供了便利的融资渠道。近年来,随着互联网金融的逐步发展,P2P网贷已成为时下炙手可热的互联网金融新模式。凭借着“高收益”的理财优势,各类P2P网贷平台呈现逐年增长的态势。目前,我国正常运行P2P平台数量已达近3000家,累计成交量约8000亿元。
然而,网贷业在爆发式增长的同时,也存在着重大风险。高利率庞氏骗局、投放假标的、平台自融、洗钱、资金挪用、虚报理财业绩、跑路等形形色色的平台问题不断发生。大平台逾期还款,小平台跑路的新闻屡见不鲜,给投资人造成巨大损失,造成信任危机。使投资者损失惨重。目前P2P网贷面临的最大风险是信用风险,信用风险已经成为P2P网贷行业发展的主要瓶颈,而借款人信用评估则是降低信用风险、提高企业风险管理水平的决定性因素。
国内外关于P2P网贷借款人信用评估方面的相关研究主要是从评估指标和评估方法两个方面进行探讨的。由于国外具有比较完备的数据共享征信系统,所以国外对于借款人信用评估的研究不仅包括平台本身的借款人信息,还包括政府信用系统、社交网络、购物行为等其他平台共享信息;而国内关于P2P网贷的研究大都只是介绍了目前主要P2P网贷平台的运营模式,或者仅针对特定平台进行风险研究,评估指标的采用没有一个统一的标准。
因此,虽然目前应用于借款人信用风险评估的指标多达几十种,但是除了少数针对借款人个人信息的指标相同外,不同P2P网贷平台采用的其他指标都不尽相同,在研究信用风险问题时,由于采用的指标不同,给出的结论也不尽相同,很难给出指标与风险之间明确的作用关系,而关于对借款人进行信用风险评估,需要哪些基本指标作为评估标准,才能说明评估的全面性、通用性、可信性的研究鲜有报道。
另一方面,随着数据量和数据种类的不断增加,P2P网贷平台的数据量已达到了PB、EB甚至 EB级别,而随着银行信用系统、其他共享系统等平台数据的不断接入,应用大数据技术进行平台数据管理和分析已是必然。目前绝大多数借款人信用风险评估研究都是基于静态分析给出的结果,然而数据是变化的,风险在变化中产生,从动态角度,对借款人信用风险进行实时分析、跟踪监测更具实际意义。

基于上述原因,本研究应用大数据技术,建立借款人信用风险实时监测模型和风控方案,为P2P网贷平台借款人信用风险评估提供大数据架构参考。
研究内容的整体框架如图1所示:

图1 研究整体框架
大数据实时监测模型架构如图2所示:

图2 大数据实时监测模型框架
研究技术路线如图3所示:

图3 研究技术路线
Hadoop数据分析实例:P2P借款人信用风险实时监控模型设计的更多相关文章
- P2P借款人信用风险实时监控模型设计
P2P借款人信用风险实时监控模型设计 P2P网络贷款(“peer-to-peer”)为中小企业和个人提供了便利的融资渠道.近年来,随着互联网金融的逐步发展,P2P网贷已成为时下炙手可热的互联网金融新模 ...
- ActiveMQ消息队列和SignalR之日志实时监控及警报小实例
主要技术: log4net-生成日志. ActiveMQ-生成日志的时候发送消息,并实时监控日志. SignalR-将ActiveMQ监控的日志实时显示到浏览器上,而不用刷新浏览器. 小实例介绍: 左 ...
- Hadoop YARN学习监控JVM和实时监控Ganglia、Ambari(5)
Hadoop YARN学习监控JVM和实时监控Ganglia.Ambari(5) 1.0 监控ResourceManager进程Java虚拟机中堆空间的特定部分. jstat工具,在JDK的bin目录 ...
- SpringBoot 2.0 + InfluxDB+ Sentinel 实时监控数据存储
前言 阿里巴巴提供的控制台只是用于演示 Sentinel 的基本能力和工作流程,并没有依赖生产环境中所必需的组件,比如持久化的后端数据库.可靠的配置中心等.目前 Sentinel 采用内存态的方式存储 ...
- Spark+Kafka实时监控Oracle数据预警
目标: 监控Oracle某张记录表,有新增数据则获取表数据,并推送到微信企业. 流程: Kafka实时监控Oracle指定表,获取该表操作信息(日志),使用Spark Structured Strea ...
- C#实现对文件目录的实时监控
本文主要描述如何通过C#实现实时监控文件目录下的变化,包括文件和目录的添加,删除,修改和重命名等操作. 首先,我们需要对.net提供的FileSystemWatcher类有所了解.我有些懒,找了MSD ...
- Flask速成项目:Flask实现计算机资源的实时监控
很多人都说使用Python开发WEB应用非常方便,那么对于WEB新手来说,到底有多方便呢?本文即将展示给你Python的魔法. 本文将通过一个实例:Flask实现计算机资源的实时监控,迅速带你入门Fl ...
- Spring Cloud Turbine微服务集群实时监控
本文代码下载地址: https://gitlab.com/mySpringCloud/turbine SpringBoot版本:1.5.9.RELEASE (稳定版) SpringCloud版本:Ed ...
- Python中Celery 的基本用法以及Django 结合 Celery 的使用和实时监控进程
celery是什么 1 celery是一个简单,灵活且可靠的,处理大量消息的分布式系统 2 专注于实时处理的异步任务队列 3 同时也支持任务调度 执行流程 Celery 基本使用 tasks.py i ...
随机推荐
- ChinaCock界面控件介绍-CCNavigateTitle
先看一下实际项目中的运行效果,如图,通过品牌的导航栏,显示不同品牌的商品列表. 完全基于ChinaCock控件包中CCNavigateTitle组件实现的,这是一个可视控件,从组件面板上拖放一个到Fo ...
- centos安装htop
在 Linux 系统中,top 命令用来显示系统中正在运行的进程的实时状态,它显示了一些非常有用的信息,比如 CPU 利用情况.内存消耗情况,以及每个进程情况等.但是,你知道吗?还有另外一个命令行工具 ...
- 64-65管道,rm与rmdir
听说linux根目录tmp文件夹内是临时文件.用久了会产生很多垃圾文件 请问下面的临时文件怎么维护清理?全部没用删除,还是? /tmp 公用的临时文件存储点 linux下的文件结构 /bin 二进制可 ...
- java学习笔记16(正则表达式)
正则表达式: 定义:在pattern类中有简单规则定义,具有特殊含义的字符串: 作用:用于一些字符串,比如验证注册邮箱,密码,用户名等: 正则表达式的语法: 1)字符:'\'反斜杠 \t 代表制表 ...
- mysqli扩展库的预处理
预处理的特点:1.效率高,执行速度快 2.安全性高,可以防止sql注入 $mysqli 中的函数 $stmt=$mysqli->prepare($sql); 预备一条s ...
- placeholder兼容性问题
由于placeholder是H5新属性,IE9及以下都不支持 解决办法:给input添加一个背景图,背景图里面添加placeholder内容,当焦点落在输入框中,背景图隐藏,即可做出类似的效果 代码: ...
- Centos7防火墙开放8080端口
查看已经开发的端口: firewall-cmd --list-ports 开启端口: firewall-cmd --zone=public --add-port=8080/tcp --permanen ...
- 2017ICPC南宁赛区网络赛 The Heaviest Non-decreasing Subsequence Problem (最长不下降子序列)
Let SSS be a sequence of integers s1s_{1}s1, s2s_{2}s2, ........., sns_{n}sn Each integer i ...
- selenium 定位无标签的元素
转载需注明出处. 如: ::before 伪元素xpath css_selector. id. class_name各种定位失效,可以选择用, .get_attribute('innerHTML')方 ...
- 九度OJ-1131-合唱排队-双向递增子序列
题目1131:合唱队形 时间限制:1 秒 内存限制:32 兆 特殊判题:否 提交:4948 解决:1570 题目描述: N位同学站成一排,音乐老师要请其中的(N-K)位同学出列,使得剩下的K位同学不交 ...