python 数据分析与挖掘实战01
python 数据分析与挖掘实战
day 01 08/02
这种从数据中“淘金”,从大量数据包括文本中挖掘出隐含的、未知的、对决策有潜在价值关系、模式或者趋势,并用这些知识和规则建立用于决策支持的模型、提供预测性决策支持的方法、工具和过程就是数据挖掘。
数据挖掘的基本任务就是包括利用>>>>>>分类与预测、聚类、关联规则、时序模式、偏差检测和智能推荐等方法找到meta-relationship
要针对具体的数据挖掘需求,首先应该明确本次挖掘的目的是什么?系统完成后能达到什么样的效果,故这就要求我们>>>>>>>>收悉相关背景、弄清用户需求。为了更充分的利用数据,我们必须要对目标下个明确的定义,明确到底要做什么。
\]
抽取数据的标准:1相关性
2可靠性
3有效性
数据探索:
\]
模型评价就是从众多模型中找到一个最好的,并且根据业务对模型惊醒解释和应用
#字符串拼接与分割
s = "I like playing"
s += "football"
s.split(" ")
python使用缩进对齐作为语句的层次标记,同一层次的缩进一一对应
s,k = 0,0
while k <= 99:
k += 1
s += k
print(s)
s=0
for k in range (101):
s += k
print(s)
in 用来判断一个元素是否在列表、元组中
def add2 (x):
return 2**x
print(add2(4))
def add3 (x,y):
return x+10,y-10
a,b = add3(1,1)
print(a)
print((a,b))
print([a,b])
print({a,b})
f = lambda x : x+2
print(f(3))
g = lambda x,y : x+y
print(g(1,2))
为什么会引进lambda函数,因为对于def定义类似add2()这样的简单函数,用def进行命名有点小题大做,故我们可以引进lambda对简单功能的定义“行内函数”类似于matlab中的匿名函数
g = lambda x,y:[x*y,x+y]
print(g(1,2))
python中有四个内建的数据结构(统成为容器):
\]
其中列表:[ ] & 元组 : ( ) ;列表是可变的,元组是不可变的
列表复制的方法为:
b = a[:]
list("iguiasdhfioujas")
>>['i', 'g', 'u', 'i', 'a', 's', 'd', 'h', 'f', 'i', 'o', 'u', 'j', 'a', 's']
tuple("iguiasdhfioujas")
>>('i', 'g', 'u', 'i', 'a', 's', 'd', 'h', 'f', 'i', 'o', 'u', 'j', 'a', 's')
a = [1,2,3]
b = []
for i in (a):
b.append(i+4)
>>[5, 6, 7]
a = range(49)
b=[i +1 for i in a]
print(b)
>>[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
set_one = set([1,2,"a","b"])
set_two = set([3,4,"a","c"])
print(set_one | set_two)
>>{1, 2, 3, 4, 'c', 'a', 'b'}
print(set_one & set_two)
>>{'a'}
print(set_one - set_two)
>>{1, 2, 'b'}
print(set_one ^set_two) #异或
>>{1, 2, 3, 4, 'c', 'b'}
len((set_one ^set_two))#可以用来计算两个集合之间的汉明距离
>>6
f = {1,2,3,"dasfads","sdafasdf"}
print(f)
>>{1, 2, 3, 'sdafasdf', 'dasfads'}
这都是集合之间的运算,不要运用在别的数据结构(容器上),并、交、差、异或(两个集合中只有出现,仅仅出现过一次的元素才会写进新的集合)。
a = [1,2,3]
b= [i**2 for i in a]
>>[1, 4, 9]
d = {"123w43e" : 23,"asdfasf":"asdfa"}
d["123w43e"]
>>23
python 数据分析与挖掘实战01的更多相关文章
- 【读书笔记与思考】《python数据分析与挖掘实战》-张良均
[读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...
- 学习参考《Python数据分析与挖掘实战(张良均等)》中文PDF+源代码
学习Python的主要语法后,想利用python进行数据分析,感觉<Python数据分析与挖掘实战>可以用来学习参考,理论联系实际,能够操作数据进行验证,基础理论的内容对于新手而言还是挺有 ...
- python数据分析与挖掘实战
<python数据分析与挖掘实战>PDF&源代码&张良均 下载:链接:https://pan.baidu.com/s/1TYb3WZOU0R5VbSbH6JfQXw提取码: ...
- python数据分析与挖掘实战第二版pdf-------详细代码与实现
[书名]:PYTHON数据分析与挖掘实战 第2版[作者]:张良均,谭立云,刘名军,江建明著[出版社]:北京:机械工业出版社[时间]:2020[页数]:340[isbn]:9787111640028 学 ...
- 《Python数据分析与挖掘实战》读书笔记
大致扫了一遍,具体的代码基本都没看了,毕竟我还不懂python,并且在手机端的排版,这些代码没法看. 有收获,至少了解到以下几点: 一. Python的语法挺有意思的 有一些类似于JavaSc ...
- python数据分析与挖掘实战————银行分控模型(几种算法模型的比较)
一.神经网络算法: 1 import pandas as pd 2 from keras.models import Sequential 3 from keras.layers.core impor ...
- 《Python数据分析与挖掘实战》-第四章-数据预处理
点我看原版
- Python数据分析与挖掘所需的Pandas常用知识
Python数据分析与挖掘所需的Pandas常用知识 前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...
- 《MATLAB数据分析与挖掘实战》赠书活动
<MATLAB数据分析与挖掘实战>是泰迪科技在数据挖掘领域探索10余年经验总结与华南师大.韩山师院.广东工大.广技师 等高校资深讲师联合倾力打造的巅峰之作.全书以实践和实用为宗旨,深度 ...
随机推荐
- Kafka 消费者及消费者分区策略
消费方式: consumer 采用 pull(拉)模式从 broker 中读取数据. push(推)模式很难适应消费速率不同的消费者,因为消息发送速率是由 broker 决定的. 它的目标是尽可能以最 ...
- 这些表情包你有吗?来 Battle 啊
"能用表情包解决的问题,绝不多说一个字." "当不知道回复什么的时候,甩过去一个表情包就好了." 放眼望去,谁的 QQ/微信 收藏中没有几页代表性的表情包,那真 ...
- brctl 增加桥接网卡
前言 之前有一篇介绍配置桥接网卡的,这个桥接网卡一般是手动做虚拟化的时候会用到,通过修改网卡的配置文件的方式会改变环境的原有的配置,而很多情况,我只是简单的用一下,并且尽量不要把网络搞断了,万一有问题 ...
- Android Support v4\v7\v13和AndroidX理解【转载】
为什么要用support库呢? 因为在低版本Android平台上开发一个APP时,想使用高版本才有的功能,此时就需要使用Support来支持兼容. 1. android-support-v4 comp ...
- kali 安装redis
wget http://download.redis.io/releases/redis-2.8.3.tar.gz 下载 tar xzf redis-2.8.3.tar.gz ...
- 如何输入x的平方
随着电脑的普及,现在都流行在电脑上做教学课件,撰写文章,尤其是理科文献,涉及的数学符号有很多,它包括了我们常见的四则运算符号和平方.立方等,也包括了高等数学中用到的积分.极限符号等,打这些公式就需要用 ...
- 使用Camtasia制作游戏直播高能短视频
随着电竞行业的兴起,很多主播都开始做起游戏直播.对于喜欢打游戏的朋友来说,观看游戏直播既可以提高游戏的技术,也能作为下班后的休闲娱乐.对于喜欢钻研游戏技术的朋友,制作一个游戏高能合集能也是一件很燃的事 ...
- 如何在Guitar Pro上添加吉他和弦
Guitar Pro是一款很适合广大吉他爱好者的优秀吉他谱学习与制谱软件,吉他爱好者可以使用它来更好的辅助自己学习吉他.在我们根据弹唱时,都会跟着谱子上标记的和弦来弹奏,不同的和弦有着不同的风格,或暗 ...
- Spring Boot第一天
1.首先在idea中创建一个maven项目,创建成功后在pom.xml中添加SpringBoot相关的依赖 <!--引入SpringBoot相关的依赖--> <parent> ...
- Leetcode 周赛#202 题解
本周的周赛题目质量不是很高,因此只给出最后两题题解(懒). 1552 两球之间的磁力 #二分答案 题目链接 题意 有n个空篮子,第i个篮子位置为position[i],现希望将m个球放到这些空篮子,使 ...