[Python数据挖掘]第7章、航空公司客户价值分析

【[Python数据挖掘]第7章、航空公司客户价值分析】的更多相关文章

Python数据挖掘-航空公司客户价值分析

出处:http://www.ithao123.cn/content-11127869.html 航空公司客户价值分析目标:企业针对不同价值的客户制定个性化的服务,将有限的资源集中于高价值客户. 1.借助航空公司的数据进行客户分类 2.比较不同类客户的价值并制定销策略识别客户价值的最广泛的模型是通过RFM模型来识别出高价值的客户: Recency: 最近消费时间间隔 Frequency: 消费频率 Monetary: 消费金额问题:同样的消费金额的不同旅客对航空公司的价值不同,例如买长航线.…

航空公司客户价值分析（KMeans聚类）

PS.图片可能不清楚,代码数据集都在 https://github.com/xubin97/Data-Mining_exp1 项目介绍: 本案例的目标是客户价值识别,通过航空公司客户数据识别不同价值的客户.识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔.消费频带和消费金额)来进行客户细分,识别出高价值的客户,简称REFM . 在RFM模型中,消费金额表示在一段时间内, 客户购买该企业产品金额的总和由于航空票价受到运输距离.舱位等级等多种因素影响,同样消费金额的不同旅名对航空公司的…

基于R语言的航空公司客户价值分析

分析航空公司现状 1.行业内竞争民航的竞争除了三大航空公司之间的竞争之外,还将加入新崛起的各类小型航空公司.民营航空公司,甚至国外航空巨头.航空产品生产过剩,产品同质化特征愈加明显,于是航空公司从价格.服务间的竞争逐渐转向对客户的竞争. 2.行业外竞争随着高铁.动车等铁路运输的兴建,航空公司受到巨大冲击. 航空公司客户数据说明目前航空公司已积累了大量的会员档案信息和其乘坐航班记录. 以2014-03-31为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户…

[Python数据挖掘]第7章、航空公司客户价值分析

一.背景和挖掘目标二.分析方法与过程客户价值识别最常用的是RFM模型(最近消费时间间隔Recency,消费频率Frequency,消费金额Monetary) 1.EDA(探索性数据分析) #对数据进行基本的探索 import pandas as pd data = pd.read_csv('data/air_data.csv', encoding = 'utf-8') #读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码) explore = data.descri…

利用KMeans聚类进行航空公司客户价值分析

准确的客户分类的结果是企业优化营销资源的重要依据,本文利用了航空公司的部分数据,利用Kmeans聚类方法,对航空公司的客户进行了分类,来识别出不同的客户群体,从来发现有用的客户,从而对不同价值的客户类别提供个性化服务,指定相应的营销策略. 一.分析方法和过程 1.数据抽取——>2.数据探索与预处理——>3.建模与应用传统的识别客户价值应用最广泛的模型主要通过3个指标(最近消费时间间隔(Recency).消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别出价值高…

[Python数据挖掘]第6章、电力窃漏电用户自动识别

一.背景与挖掘目标相关背景自查二.分析方法与过程 1.EDA(探索性数据分析) 1.分布分析 2.周期性分析 2.数据预处理 1.数据清洗过滤非居民用电数据,过滤节假日用电数据(节假日用电量明显低于工作日) 2.缺失值处理 #拉格朗日插值代码 import pandas as pd #导入数据分析库Pandas from scipy.interpolate import lagrange #导入拉格朗日插值函数 data = pd.read_excel('data/missing_dat…

[Python数据挖掘]第4章、数据预处理

数据预处理主要包括数据清洗.数据集成.数据变换和数据规约,处理过程如图所示. 一.数据清洗 1.缺失值处理:删除.插补.不处理 ## 拉格朗日插值代码(使用缺失值前后各5个未缺失的数据建模) import pandas as pd #导入数据分析库Pandas from scipy.interpolate import lagrange #导入拉格朗日插值函数 inputfile = '../data/catering_sale.xls' #销量数据路径 outputfile = '../tmp…

[Python数据挖掘]第2章、Python数据分析简介

<Python数据分析与挖掘实战>的数据和代码,可从“泰迪杯”竞赛网站(http://www.tipdm.org/tj/661.jhtml)下载获得 1.Python数据结构 2.Numpy数组 import numpy as np #一般以np作为numpy的别名 a = np.array([2, 0, 1, 5]) #创建数组 print(a) #输出数组 print(a[:3]) #引用前三个数字(切片) print(a.min()) #输出a的最小值 a.sort() #将a的元素从小…

[Python数据挖掘]第8章、中医证型关联规则挖掘

一.背景和挖掘目标二.分析方法与过程 1.数据获取 2.数据预处理 1.筛选有效问卷(根据表8-6的标准) 共发放1253份问卷,其中有效问卷数为930 2.属性规约 3.数据变换 ''' 聚类离散化,最后的result的格式为: 1 2 3 4 A 0 0.178698 0.257724 0.351843 An 240 356.000000 281.000000 53.000000 即(0, 0.178698]有240个,(0.178698, 0.257724]有356个,依此类推. '…

[Python数据挖掘]第5章、挖掘建模（下）

四.关联规则 Apriori算法代码(被调函数部分没怎么看懂) from __future__ import print_function import pandas as pd #自定义连接函数,用于实现L_{k-1}到C_k的连接 def connect_string(x, ms): x = list(map(lambda i:sorted(i.split(ms)), x)) l = len(x[0]) r = [] for i in range(len(x)): for j in rang…