python 数据分析与挖掘实战

day 01 08/02

这种从数据中“淘金”,从大量数据包括文本中挖掘出隐含的、未知的、对决策有潜在价值关系、模式或者趋势,并用这些知识和规则建立用于决策支持的模型、提供预测性决策支持的方法、工具和过程就是数据挖掘。

数据挖掘的基本任务就是包括利用>>>>>>分类与预测、聚类、关联规则、时序模式、偏差检测和智能推荐等方法找到meta-relationship

要针对具体的数据挖掘需求,首先应该明确本次挖掘的目的是什么?系统完成后能达到什么样的效果,故这就要求我们>>>>>>>>收悉相关背景、弄清用户需求。为了更充分的利用数据,我们必须要对目标下个明确的定义,明确到底要做什么。

\[1目标定义>>2数据采集>>3数据整理>>4构建模型>>5模型评价>>6模型发布\\其中5包括建立评价标准、多模型对比和调参优化
\]

抽取数据的标准:1相关性

​ 2可靠性

​ 3有效性

数据探索:

\[异常值分析\\缺失值分析\\相关分析\\周期性和分析
\]

模型评价就是从众多模型中找到一个最好的,并且根据业务对模型惊醒解释和应用

#字符串拼接与分割
s = "I like playing"
s += "football"
s.split(" ")

python使用缩进对齐作为语句的层次标记,同一层次的缩进一一对应

s,k = 0,0
while k <= 99:
k += 1
s += k print(s)
s=0
for k in range (101):
s += k print(s)

in 用来判断一个元素是否在列表、元组中

def add2 (x):
return 2**x
print(add2(4))
def add3    (x,y):
return x+10,y-10
a,b = add3(1,1)
print(a)
print((a,b))
print([a,b])
print({a,b})
f =  lambda x : x+2
print(f(3))
g = lambda x,y : x+y
print(g(1,2))

为什么会引进lambda函数,因为对于def定义类似add2()这样的简单函数,用def进行命名有点小题大做,故我们可以引进lambda对简单功能的定义“行内函数”类似于matlab中的匿名函数

g = lambda x,y:[x*y,x+y]
print(g(1,2))

python中有四个内建的数据结构(统成为容器):

\[List、tuple、dictionary、set
\]

其中列表:[ ] & 元组 : ( ) ;列表是可变的,元组是不可变的

列表复制的方法为:

b = a[:]
list("iguiasdhfioujas")
>>['i', 'g', 'u', 'i', 'a', 's', 'd', 'h', 'f', 'i', 'o', 'u', 'j', 'a', 's']
tuple("iguiasdhfioujas")
>>('i', 'g', 'u', 'i', 'a', 's', 'd', 'h', 'f', 'i', 'o', 'u', 'j', 'a', 's')
a = [1,2,3]
b = []
for i in (a):
b.append(i+4) >>[5, 6, 7] a = range(49)
b=[i +1 for i in a]
print(b)
>>[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
set_one = set([1,2,"a","b"])
set_two = set([3,4,"a","c"])
print(set_one | set_two)
>>{1, 2, 3, 4, 'c', 'a', 'b'}
print(set_one & set_two)
>>{'a'}
print(set_one - set_two)
>>{1, 2, 'b'}
print(set_one ^set_two) #异或
>>{1, 2, 3, 4, 'c', 'b'}
len((set_one ^set_two))#可以用来计算两个集合之间的汉明距离
>>6
f = {1,2,3,"dasfads","sdafasdf"}
print(f)
>>{1, 2, 3, 'sdafasdf', 'dasfads'}

这都是集合之间的运算,不要运用在别的数据结构(容器上),并、交、差、异或(两个集合中只有出现,仅仅出现过一次的元素才会写进新的集合)。

a = [1,2,3]
b= [i**2 for i in a]
>>[1, 4, 9]
d = {"123w43e" : 23,"asdfasf":"asdfa"}
d["123w43e"]
>>23

python 数据分析与挖掘实战01的更多相关文章

  1. 【读书笔记与思考】《python数据分析与挖掘实战》-张良均

    [读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...

  2. 学习参考《Python数据分析与挖掘实战(张良均等)》中文PDF+源代码

    学习Python的主要语法后,想利用python进行数据分析,感觉<Python数据分析与挖掘实战>可以用来学习参考,理论联系实际,能够操作数据进行验证,基础理论的内容对于新手而言还是挺有 ...

  3. python数据分析与挖掘实战

    <python数据分析与挖掘实战>PDF&源代码&张良均 下载:链接:https://pan.baidu.com/s/1TYb3WZOU0R5VbSbH6JfQXw提取码: ...

  4. python数据分析与挖掘实战第二版pdf-------详细代码与实现

    [书名]:PYTHON数据分析与挖掘实战 第2版[作者]:张良均,谭立云,刘名军,江建明著[出版社]:北京:机械工业出版社[时间]:2020[页数]:340[isbn]:9787111640028 学 ...

  5. 《Python数据分析与挖掘实战》读书笔记

    大致扫了一遍,具体的代码基本都没看了,毕竟我还不懂python,并且在手机端的排版,这些代码没法看. 有收获,至少了解到以下几点: 一. Python的语法挺有意思的     有一些类似于JavaSc ...

  6. python数据分析与挖掘实战————银行分控模型(几种算法模型的比较)

    一.神经网络算法: 1 import pandas as pd 2 from keras.models import Sequential 3 from keras.layers.core impor ...

  7. 《Python数据分析与挖掘实战》-第四章-数据预处理

    点我看原版

  8. Python数据分析与挖掘所需的Pandas常用知识

    Python数据分析与挖掘所需的Pandas常用知识 前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...

  9. 《MATLAB数据分析与挖掘实战》赠书活动

    <MATLAB数据分析与挖掘实战>是泰迪科技在数据挖掘领域探索10余年经验总结与华南师大.韩山师院.广东工大.广技师   等高校资深讲师联合倾力打造的巅峰之作.全书以实践和实用为宗旨,深度 ...

随机推荐

  1. linux中几个文本文件查看命令

    Linux中,常用的文本文件查看命令介绍如下: 1. cat 用法: cat [options] filename options: -A: 显示全部. -E: 在每一行的后面加上"$&qu ...

  2. 基于FFmpeg的Dxva2硬解码及Direct3D显示(五)

    解码及显示 目录 解码及显示 解码 显示 资源清理 解码 循环读取视频帧 AVPacket packet = { 0 }; while (av_read_frame(m_pFmtCtx, &p ...

  3. peterson算法(软件互斥 转)

    1. 背景        首先,看个例子,进程P1,P2共用一个变量COUNT,初始值为0                                                 因为P1,P ...

  4. linux系统中离线安装python3.7过程记录

    最近公司新弄来一台linux  redhat 4.4.7服务器,准备在上面离线安装python3.7,安装过程中出现一些问题,特此记录下来. 首先在python官网上下载了 Python-3.7.3. ...

  5. linux文件描述符、软硬连接、输入输出重定向

    引用链接:https://blog.csdn.net/qq769651718/article/details/79459346 文件描述符的作用: 文件描述符是linux操作系统中特有的概念.其相当于 ...

  6. 利用s3-test进行ceph的接口兼容性测试

    前言 ceph的rgw能够提供一个兼容性的s3的接口,既然是兼容性,当然不可能是所有接口都会兼容,那么我们需要有一个工具来进行接口的验证以及测试,这个在其他测试工具里面有类似的posix接口验证工具, ...

  7. 转载 数据库优化 - SQL优化

    判断问题SQL判断SQL是否有问题时可以通过两个表象进行判断: 系统级别表象CPU消耗严重IO等待严重页面响应时间过长应用的日志出现超时等错误可以使用sar命令,top命令查看当前系统状态. 也可以通 ...

  8. C语言设计模式(命令模式)

    #define ARRAY_SIZE(a) (sizeof(a)/sizeof(a[0])) typedef int (*parse_func)(const char *data,size_t len ...

  9. 用JavaScript实现全选-反选

    实现全选-反选 在日常生活我们会遇到需要全选-反选的地方,其实用JavaScript也能实现. 样式如下所示: 样式代码如下所示: <!DOCTYPE html PUBLIC "-// ...

  10. dpkg 批量卸载

    dpkg -l |grep deepin|awk '{print $2}'|xargs sudo dpkg -P