Python数据分析易错知识点归纳(一):基础知识
一、python基础
字符串replace方法
txt = txt.replace(s, ' ')
# 光是txt.replace(s, ' ')是不会对txt产生影响的
# 下面每次循环replace后,w的值是不改变的
w = 'China520'
for x in w:
if '0' <= x <= '9':
continue
else:
k = w.replace(x, '')
print(k) # Chin520
字符串join方法
li = [1, 's', '4', 'b']
s = ','.join([str(each) for each in li]) # 注意必须先转成字符串列表,否则报错
如何对字典中的value进行排序
words = {}
for word in txt_list:
words[word] = words.get(word, 0) + 1
words_list = list(words.items()) # 每一个元素为(key,value)元组, 直接利用list(),这里很妙!!!
words_list.sort(key=lambda x:x[1], reverse=True)
# 或
words_list = sorted(words_list, key=lambda x:x[1], reverse=True)
字符串全部改为小写,并将特殊字符剔除
def getText():
txt = open("hamlet.txt", "r").read()
txt = txt.lower() # 这里不用循环
for s in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
txt = txt.replace(s, ' ')
return txt
字符串切割split
txt_list = txt.split() # 不带参数时默认用空格切割
字典update/pop方法
clerkDict.update({"mobile":"18930964799","city":"shanghai"}) # 更新或新增合并到clerkDict
clerkDict.pop("city") # 删除city项 这里不带参数
巧用set去重
s = s.replace('\n', ' ')
names = set(s.split())
巧用list()
字典转元组嵌套的列表方法:li = list(dic.items())
遍历过程中对list进行操作
dat = ['1', '2', '3', '0', '0', '0']
for item in dat:
if item == '0':
dat.remove(item) # 每次只删除第一次匹配的
print(dat)
'''
['1', '2', '3', '0']
'''
eval()的用法: 用来执行一个字符串表达式,并返回表达式的值。
input = input()
input_dict = eval(input) # 这里不需要再加dict()
>>>x = 7
>>> eval( '3 * x' )
21
>>> eval('pow(2,2)')
4
>>> eval('2 + 2')
4
>>> n=81
>>> eval("n + 4")
85
捕获异常是try... except...finally
try:
...
except: # 这里可以不写具体的错误类型
print('输入错误')
进制
含b 二进制
含o 八进制
含x 十六进制
oct() 转八进制
hex() 转十六进制
int() 转八进制或十六进制
print(0o1) # 1
print(0x01) # 1
print(oct(64)) # 0o100
print(hex(255)) # 0xff
print(int('0100')) # 100
print(int('0o100', 8)) # 64
print(int('0x40', 16)) # 64
# eval函数也可以转换,但速度会稍慢些
print(eval('100')) # 100
print(eval('0o100')) # 64
print(eval('0x40')) # 64
File
fileStr=fileStr.strip() # 去除头尾空格、\n、\r、\t
# lstrip() 去除左边的 rstrip() 去除右边的
# open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
f = open(path)
for each_line in f.readlines():
li = each_line.strip().split(',')


os/os.path


pickle
file = open("c:/person.txt", "wb") # python3必须以二进制写入模式
pickle.dump(person, file) # 将字典序列化写入文件
file.close()
# 将person字典从文件中读取
file = open("c:/person.txt", "rb")
personFromFile = pickle.load(file)
# numpy读取文件
data = np.loadtxt('iris_data.csv')
逗号和分号
# 一行写几条语句,也是python唯一用分号的地方
x = 1;y = 2;z = 3
a,b,c = 1,2,3
# 赋值
x = y = z = 1
range
# start和end一样时,不执行
for i in range(1, 1):
print(i)
列表比较
list1 = [1, 2]
list4 = [1, 2, 3, 4]
print(list1 < list4) # True
$ | - ^
注意一定要是set(集合)才能做此操作,否则报错
top_10_by_perc = set(df_sort_by_perc[:10]['no'].values.tolist())
top_10_by_vol = set(df_sort_by_vol[:10]['no'].values.tolist())
print('涨幅和成交量均在前10名的股票:')
print(sorted(top_10_by_perc & top_10_by_vol))
print('涨幅或成交量在前10名的股票:')
print(sorted(top_10_by_perc | top_10_by_vol))
print('涨幅前10名,但成交量未进前10名的股票:')
print(sorted(top_10_by_perc - top_10_by_vol))
print('涨幅和成交量不同时在前10名的股票:')
print(sorted(top_10_by_perc ^ top_10_by_vol)) # ^号等于|减去&
Python数据分析易错知识点归纳(一):基础知识的更多相关文章
- python函数-易错知识点
定义函数: def greet_users(names): #names是形参 """Print a simple greeting to each user in th ...
- JavaScript易错知识点整理
前言 本文是我学习JavaScript过程中收集与整理的一些易错知识点,将分别从变量作用域,类型比较,this指向,函数参数,闭包问题及对象拷贝与赋值这6个方面进行由浅入深的介绍和讲解,其中也涉及了一 ...
- JavaScript 易错知识点整理
本文是我学习JavaScript过程中收集与整理的一些易错知识点,将分别从变量作用域,类型比较,this指向,函数参数,闭包问题及对象拷贝与赋值这6个方面进行由浅入深的介绍和讲解,其中也涉及了一些ES ...
- JavaScript易错知识点整理[转]
前言 本文是我学习JavaScript过程中收集与整理的一些易错知识点,将分别从变量作用域,类型比较,this指向,函数参数,闭包问题及对象拷贝与赋值这6个方面进行由浅入深的介绍和讲解,其中也涉及了一 ...
- JS易错知识点
JAVASCRIPT易错知识点整理 前言 本文是学习JavaScript过程中收集与整理的一些易错知识点,将分别从变量作用域,类型比较,this指向,函数参数,闭包问题及对象拷贝与赋值这6个方面进行由 ...
- Java易错知识点(1) - 关于ArrayList移除元素后剩下的元素会立即重排
帮一个网友解答问题时,发现这样一个易错知识点,现总结如下: 1.易错点: ArrayList移除元素后,剩下的元素会立即重排,他的 size() 也会立即减小,在循环过程中容易出错.(拓展:延伸到所有 ...
- JavaScript易错知识点
JavaScript易错知识点整理1.变量作用域上方的函数作用域中声明并赋值了a,且在console之上,所以遵循就近原则输出a等于2. 上方的函数作用域中虽然声明并赋值了a,但位于console之下 ...
- 【转载】Python编程中常用的12种基础知识总结
Python编程中常用的12种基础知识总结:正则表达式替换,遍历目录方法,列表按列排序.去重,字典排序,字典.列表.字符串互转,时间对象操作,命令行参数解析(getopt),print 格式化输出,进 ...
- Python编程中常用的12种基础知识总结
原地址:http://blog.jobbole.com/48541/ Python编程中常用的12种基础知识总结:正则表达式替换,遍历目录方法,列表按列排序.去重,字典排序,字典.列表.字符串互转,时 ...
- python六十七课——网络编程(基础知识了解)
网络编程: 什么是网络编程? 网络:它是一种隐形的媒介:可以将多台计算机使用(将它们连接到一起) 网络编程:将多台计算机之间可以相互通信了(做数据交互) 一旦涉及到网络编程,划分为两个方向存在,一方我 ...
随机推荐
- 学习C语言的第一天
今天学习C语言学习了三个部分: 第一个部分是软件环境的搭建,如何搭建一个项目 使用工具:visual studio 2010 搭建过程:新建项目.配置设置(主要是解决运行后一闪而过的问题) 第二部分是 ...
- DRF的认证组件(源码分析)
DRF认证组件(源码分析) 1. 数据库建立用户表 在drf中也给我们提供了 认证组件 ,帮助我们快速实现认证相关的功能,例如: # models.py from django.db import m ...
- docker启动mysql注意事项
1.编码问题 登录mysql伪终端 mysql查看编码 show variables like 'character%'; 宿主机在conf.d中添加配置my.cnf文件 [client] defau ...
- WPF Button MouseDown事件
Button的MouseDown事件 WPF的Button控件,鼠标点击时,MouseDown事件没有触发. 经确认,Button的MouseDown被内部处理了.下面是基类ButtonBase的部分 ...
- 【Python基础】数据类型与类型转换
五种基本数据类型 在 Python 中,基本数据类型是指不可变对象的数据类型.以下是 Python 中的基本数据类型: 整数类型(int):表示整数,例如 1.2.3 等等. 浮点数类型(float) ...
- 2022-12-26:有一个数组包含0、1、2三种值, 有m次修改机会,第一种将所有连通的1变为0,修改次数-1, 第二种将所有连通的2变为1或0,修改次数-2, 返回m次修改机会的情况下,让最大的0
2022-12-26:有一个数组包含0.1.2三种值, 有m次修改机会,第一种将所有连通的1变为0,修改次数-1, 第二种将所有连通的2变为1或0,修改次数-2, 返回m次修改机会的情况下,让最大的0 ...
- 2021-03-18:给定一个字符串str,只由‘X’和‘.’两种字符构成。‘X’表示墙,不能放灯,也不需要点亮,‘.’表示居民点,可以放灯,需要点亮。如果灯放在i位置,可以让i-1,i和i+1三个位置被点亮。返回如果点亮str中所有需要点亮的位置,至少需要几盏灯。
2021-03-18:给定一个字符串str,只由'X'和'.'两种字符构成.'X'表示墙,不能放灯,也不需要点亮,'.'表示居民点,可以放灯,需要点亮.如果灯放在i位置,可以让i-1,i和i+1三个位 ...
- 2022-02-05:字典序的第K小数字。 给定整数 n 和 k,找到 1 到 n 中字典序第 k 小的数字。 注意:1 ≤ k ≤ n ≤ 10**9。 示例 : 输入: n: 13 k: 2
2022-02-05:字典序的第K小数字. 给定整数 n 和 k,找到 1 到 n 中字典序第 k 小的数字. 注意:1 ≤ k ≤ n ≤ 10**9. 示例 : 输入: n: 13 k: 2 输出 ...
- LOTO示波器如何测试阻抗的频响曲线
LOTO示波器如何测试阻抗的频响曲线 模块的输入输出端口,在电路分析上,一般简单表征为电阻来进行计算和分析.但多数情况下,这些端口并不是纯电阻的特性,更精确一些,它可能是电阻电容以及电感的组合,表现为 ...
- tkinter的Entry设置为不可编辑状态
前 首先我们知道,tkinter中有许许多多的控件,其中使用频繁的控件之一就是Entry(输入框),那么怎么设置它为不可编辑状态呢? state选项 一般我们在写Entry的时候只传入了一个maste ...