Pandas常用命令

一.数据导入和导出

（一）读取csv文件

1.本地读取

import pandas as pd

df = pd.read_csv('tips.csv')  #根据自己数据文件保存的路径填写(p.s.  python填写路径时，要么使用/，要么使用\\)

2.网络读取

import pandas as pd

data_url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv" #填写url读取

df = pd.read_csv(data_url)

3.读取数据库

# 读取mysql 数据

con = pymysql.connect(host='192.168.159.129',user='root',password="mysql",database='mysql',port=3306,charset='utf8')

a = pd.read_sql_query('select * from user;',con=con)

print(type(a))

二.提取和筛选需要的数据

print(df.head())  #打印数据前五行

print(df.tail())  #打印数据后5行

print(df.columns)  #打印列名

print(df.index)     #打印行名

print(df.ix[10:20, 0:3])  #打印10~20行前三列数据

print(df.iloc[[1,3,5],[2,4]])    #提取不连续行和列的数据，这个例子提取的是第1,3,5行，第2,4列的数据

print(df.iat[3,2])    #专门提取某一个数据，这个例子提取的是第三行，第二列数据（默认从0开始算）

print(df.drop(df.columns[1, 2], axis = 1)) #舍弃数据前两列

print(df.drop(df.columns[[1, 2]], axis = 0)) #舍弃数据前两行

print(df.shape) #打印维度

print(df.iloc[3]) #选取第3行

print(df.iloc[2:4]) #选取第2到第3行

print(df.iloc[0,1]) #选取第0行1列的元素

print(df.dtypes)   # 查看数据类型

print(df[df.tip > 8 ]) #选取tip列大于8的

#数据筛选同样可以用”或“和”且“作为筛选条件，比如

df[(df.tip>7)|(df.total_bill>50)] #筛选出小费大于$7或总账单大于$50的数据

df[(df.tip>7)&(df.total_bill>50)] #筛选出小费大于$7且总账单大于$50的数据

df[['day','time']][(df.tip>7)|(df.total_bill>50)]  #假如加入了筛选条件后，我们只关心day和time

print(df.describe()) #描述性统计

三.数据处理

1.数据转置

print(df.T)

2.数据排序

print(df.sort_values(by='size',ascending=False)) # 根据 size 列进行排序，ascending=False 降序。默认升序

四.缺失值处理

1.填充缺失值

df['tip'].fillna("hello") # 指定数据代替缺失值

df['tip'].fillna(method='pad') #用前一个数据代替缺失值

df['tip'].fillna(method='bfill') #用后一个数据代替缺失值

2.删除缺失值

df['tip'].dropna(axis=0) #删除缺失行

df['tip'].dropna(axis=1) #删除缺失列

五.数据分组

group = df.groupby('day') #按day这一列进行分组

print(group.first())#打印每一组的第一行数据

print(group.last())#打印每一组的最后一行数据

六.保持数据

1.写入数据库

# 导入必要模块

import pandas as pd

from sqlalchemy import create_engine

# 初始化数据库连接，使用pymysql模块

# MySQL的用户：root, 密码:mysql, 端口：3306,数据库：mydb

# 读取csv 数据

df = pd.read_csv('tips.csv')

engine = create_engine('mysql+pymysql://root:mysql@192.168.159.129:3306/my_data?charset=utf8')

df.to_sql('tips', con=engine, index=True,if_exists='fail')  # 将df 数据读取写入到mysql 数据库，表名为 tips，index=True 表示写入行索引

if_exists 存在“fail”、“replace”、“append”，则默认为“fail”

如果表已经存在，如何进行操作。

*fail：引发ValueError。

*replace：在插入新值之前删除表。

*append：在现有表中插入新值。

Pandas常用命令的更多相关文章

[译]Pandas常用命令对照清单
我们在内容中使用以下简写: df pandas的DataFrame对象 s pandas的Series对象导入以下包开始 import pandas as pd import numpy as np ...
[Python]Conda 介绍及常用命令
一.介绍 Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算.数据分析的 Python 包.其使用conda系统进行 ...
Ubuntu常用命令及git常用命令
1. CMakeLists.txt中指定OpenCV路径 set(OPENCV_DIR /***/***/opencv-2.4.9) 2. cmake工程编译安装 mkdir build cd bui ...
ubuntu源与常用python配置pip源(win)、pip常用命令
pip常用命令 ubuntu更新系统源首先备份/etc/apt/sources.list mv /etc/apt/sources.list /etc/apt/sources.list.bak 然后下 ...
Linux 常用命令（持续补充）
常用命令: command &:将进程放在后台执行 ctrl + z:暂停当前进程并放入后台 jobs:查看当前后台任务 bg( %id):将任务转为后台执行 fg( %id):将任务调回前 ...
LVM基本介绍与常用命令
一.LVM介绍LVM是 Logical Volume Manager(逻辑卷管理)的简写,它是Linux环境下对磁盘分区进行管理的一种机制LVM - 优点:LVM通常用于装备大量磁盘的系统,但它同样适 ...
Linux学习笔记（一）：常用命令
经过统计Linux中能够识别的命令超过3000种,当然常用的命令就远远没有这么多了,按照我的习惯,我把已经学过的Linux常用命令做了以下几个方面的分割: 1.文件处理命令 2.文件搜索命令 3.帮助 ...
git常用命令（持续更新中）
git常用命令(持续更新中) 本地仓库操作git int 初始化本地仓库git add . ...
【原】npm 常用命令详解
今年上半年在学习gulp的使用,对npm的掌握是必不可少的,经常到npm官网查询文档让我感到不爽,还不如整理了一些常用的命令到自己博客上,于是根据自己的理解简单翻译过来,终于有点输出,想学习npm这块 ...

随机推荐

【贪心策略】渡河(river)
“假舟楫者,非能水也,而绝江河.”这句话说的是,借助渡船的人,不是会游水,却能横渡江河. 会游水的人反而不一定能顺利地横渡江河.由于江面风浪很大,他们必须潜泳渡河.这就必须用到氧气瓶.氧气瓶当然是出题 ...
消除JQuery Mobile 列表样式右侧箭头
有时候我们看到JQM上面有一些呈现跟我们要的很像如下面这个Listview效果程序代码如下: view sourceprint? 1.<ul data-role="listvie ...
Python之文件与目录操作（os、zipfile、tarfile、shutil）
Python中可以用于对文件和目录进行操作的内置模块包括: 模块/函数名称功能描述 open()函数文件读取或写入 os.path模块文件路径操作 os模块文件和目录简单操作 zipfile模 ...
android adb介绍
1. 什么是adb 在SDK的Tools文件夹下包含着Android模拟器操作的重要命令ADB,ADB的全称为Android Debug Bridge,就是调试桥的作用.可以与模拟器或android设 ...
Python数据分析初始（一）
基础库 pandas:python的一个数据分析库(pip install pandas) pandas 是基于 NumPy 的一个 python 数据分析包,主要目的是为了数据分析 .它提供了大量 ...
centos6 pyenv和virtualenv搭建python虚拟环境
安装pyenv 基础环境软件包安装 yum -y install gcc gcc-c++ make git patch openssl-devel zlib-devel readline-devel ...
蓝桥杯带分数 DFS应用
问题描述 100 可以表示为带分数的形式:100 = 3 + 69258 / 714. 还可以表示为:100 = 82 + 3546 / 197. 注意特征:带分数中,数字1~9分别出现且只出现一次( ...
nodejs安装zmq出错
想用zmq来做进程间通信,在Windows下.Centos下安装成功.记录如下: 一.Windows安装zmq 直接 npm install zmq 成功就成功. 不成功的话估计是报"未能 ...
如何让你的.vue在sublime text 3 中变成彩色?
作者:青鲤链接:https://www.zhihu.com/question/52215834/answer/129495890来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明 ...
Space Replacement
Write a method to replace all spaces in a string with %20. The string is given in a characters array ...

Pandas常用命令

Pandas常用命令的更多相关文章

随机推荐

热门专题