pandas read excel or csv

import pandas as pd

"""
pandas doc:
df.dtypes 查看数据每column 数据类型 
id       int64
x0     float64
df.reindex 查看多少行多少列的数据结构 [569 rows x 21 columns]>
df.reindex_axis 查看数据行列带数据
df.info() 查看数据每列non-null 情况
df.head(1).values 索引查看前一行数据.默认取前五行
[[ 1.33000e+02  4.49512e-01          nan  4.13178e-01  3.03781e-01
  -1.23848e-01 -1.84227e-01 -2.19076e-01  2.68537e-01  1.59960e-02
  -7.89267e-01 -3.37360e-01 -7.28193e-01 -4.42587e-01 -2.72757e-01
  -6.08018e-01 -5.77235e-01 -5.01126e-01  1.43371e-01 -4.66431e-01
  -5.54102e-01]]
......
...... 
df.tail(1) 查看最后一行数据
df[n:n+k].values取出二维数组查看第n到n+k行数据
df转numpy
df.to_numpy()[:2]取前2行：
[[ 1.330000e+02  4.495120e-01           nan  4.131780e-01  3.037810e-01
  -1.238480e-01 -1.842270e-01 -2.190760e-01  2.685370e-01  1.599600e-02
  -7.892670e-01 -3.373600e-01 -7.281930e-01 -4.425870e-01 -2.727570e-01
  -6.080180e-01 -5.772350e-01 -5.011260e-01  1.433710e-01 -4.664310e-01
  -5.541020e-01]
 [ 2.730000e+02 -1.245485e+00 -8.423170e-01 -1.255026e+00           nan
  -4.263010e-01 -1.088781e+00 -9.763920e-01 -8.988980e-01  9.834960e-01
   4.570200e-02 -4.936390e-01  3.486200e-01 -5.524830e-01 -5.268770e-01
   2.253098e+00 -8.276200e-01 -7.807390e-01 -3.769970e-01 -3.102390e-01
   1.763010e-01]]
......
......
......
df.describe() :数据分析获取每列的数量，均值，标准差,min,max,25位，50位，75位
               id            x0  ...           x18           x19
count  569.000000  5.690000e+02  ...  5.690000e+02  5.690000e+02
mean   284.000000  2.811951e-08  ... -5.272408e-09  1.230228e-08
std    164.400426  1.000880e+00  ...  1.000880e+00  1.000880e+00
min      0.000000 -2.029648e+00  ... -1.532890e+00 -1.096968e+00
25%    142.000000 -6.893850e-01  ... -6.516810e-01 -5.851180e-01
50%    284.000000 -2.150820e-01  ... -2.194300e-01 -2.299400e-01
75%    426.000000  4.693930e-01  ...  3.556920e-01  2.886420e-01
max    568.000000  3.971288e+00  ...  7.071917e+00  9.851593e+00

数据转置：行转列 df.T
df.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')据排序：axis 0行，1 column 
默认axis=0 根据列排序也就是索引，如果指定by则按照对应列排序，axis=1时，by根据行填写行名
ascending:布尔型，True则升序，可以是[True,False]，即第一字段升序，第二个降序
......
......
数据选取：
df['x0'].values 选取某一列数据
df[:n]前两行数据
或者使用df.loc[0]取索引0行数据
df.loc[0:1]取索引0到1行数据
df.loc[:,"x0":"x3"]:,单独取某列所有行用df.loc[:,"x3"]
取所有行的x0到x3之间的列
只取某几列比如x0,x7  ：  df.loc[:,["x0","x7"]]
df.iloc[0]取索引一行
df.iloc[0:4] 前三行左闭右开
取列df.iloc: print(df.iloc[:,0:4]) 前三列不支持“列名”
      id        x0        x1        x2
0    133  0.449512       NaN  0.413178
1    273 -1.245485 -0.842317 -1.255026
2    175 -1.549664 -1.126219 -1.546652
取第一行第二列：
print(df.iloc[1,2])  or print(df.at[0,"x2"])
......
......
缺失值填充：
print(df.fillna(value=5)) NaN
0    133  0.449512  5.000000  0.413178  ... -0.501126  0.143371 -0.466431 -0.554102
1    273 -1.245485 -0.842317 -1.255026  ... -0.780739 -0.376997 -0.310239  0.176301
......
......
均值查看：
print(df.mean()) mean(0)行 1 列

求和列：
df.loc["rows_sum"]=df.apply(lambda x:x.sum())
print(df)
567            2.0  1.579888  0.456187  ...  1.424827  0.237036  0.293559
568           39.0 -0.183840  0.356123  ...  0.133639 -0.819980 -0.229940
rows_sum  161596.0  0.000016  1.247216  ... -0.000005 -0.000003  0.000007
求和行:
df["rows_sum"]=df.apply(lambda x:x.sum(),axis=1)
print(df)
      id        x0        x1  ...       x18       x19    rows_sum
0    133  0.449512       NaN  ... -0.466431 -0.554102  128.790148
1    273 -1.245485 -0.842317  ... -0.310239  0.176301  266.205423
2    175 -1.549664 -1.126219  ...  0.795207 -0.149751  160.581688
......
......
"""

df=pd.read_csv('./datasets/breast_a.csv')
df["rows_sum"]=df.apply(lambda x:x.sum(),axis=1)
print(df)

数据列名称修改：

df=pd.read_csv('./datasets/breast_a.csv',index_col=False)
new_df=pd.DataFrame(df)
df1=new_df.rename(columns={"x0":"fid0","x1":"fid1"})
df1.to_csv(path_or_buf='./datasets/breast_a.csv',index=False,encoding="utf-8")

      id      fid0      fid1        x2  ...       x16       x17       x18       x19
0    133  0.449512       NaN  0.413178  ... -0.501126  0.143371 -0.466431 -0.554102
1    273 -1.245485 -0.842317 -1.255026  ... -0.780739 -0.376997 -0.310239  0.176301
2    175 -1.549664 -1.126219 -1.546652  ... -1.057501 -1.913447  0.795207 -0.149751

数据替换某一列
# print(pd.read_csv('./datasets/breast_a.csv',index_col=False))
new_df["x3"].replace(0.303781,9999,inplace=True)
print(new_df.x3)
替换所有：

df.replace(to_replace, value) 前面是需要替换的值，后面是替换后的值。

pandas read excel or csv的更多相关文章

深入理解pandas读取excel,txt,csv文件等命令
pandas读取文件官方提供的文档在使用pandas读取文件之前,必备的内容,必然属于官方文档,官方文档查阅地址 http://pandas.pydata.org/pandas-docs/versi ...
pandas 读写excel 操作（按索引和关键字读取行和列，写入csv文件）
pandas读写excel和csv操作总结按索引读取某一列的值按关键字读取某一列的值按关键字查询某一行的值保存成字典并写入新的csv import pandas as pd grades=pd ...
Pandas 基础(4) - 读/写 Excel 和 CSV 文件
这一节将分别介绍读/写 Excel 和 CSV 文件的各种方式: - 读入 CSV 文件首先是准备一个 csv 文件, 这里我用的是 stock_data.csv, 文件我已上传, 大家可以直接下载 ...
pandas处理excel文件和csv文件
一.csv文件 csv以纯文本形式存储表格数据 pd.read_csv('文件名'),可添加参数engine='python',encoding='gbk' 一般来说,windows系统的默认编码为g ...
Python处理Excel生成CSV文档
Python是一种解释型的.动态数据类型的.面向对象的高级程序设计语言.拥有丰富的处理数据和文本类库,并且得益于它是一种解释型的语言,在程序修改和功能扩展上,可以很容易做到大规模的调整.综合考虑Pyt ...
python读写word、excel、csv、json文件
http://blog.csdn.net/pipisorry/article/details/50368044 python读写word文档 (include wps)将word文档转换成txt文档 ...
pyhton读入Excel和csv数据文件
pyhton读入Excel和csv数据文件#file 数据文件的输入输出操作(主要包括Excel表格和csv表格文件)import pandas as pd #pyhton读入数据必须要导入panda ...
python pandas写入excel文件
pandas读取.写入csv数据非常方便,但是有时希望通过excel画个简单的图表看一下数据质量.变化趋势并保存,这时候csv格式的数据就略显不便,因此尝试直接将数据写入excel文件. pandas ...
PHP链式操作输出excel（csv）
工作中经常会遇到产品运营让导出一些简单的比较规范的数据,这时候要是有一个简单的方法可以用就简单多了.下面是我的一个输出简单的excel(csv)的方法类,用到了链式操作.说到链式操作,在jquery中 ...

随机推荐

POJ 1330（LCA/倍增法模板）
链接:http://poj.org/problem?id=1330 题意:q次询问求两个点u,v的LCA 思路:LCA模板题,首先找一下树的根,然后dfs预处理求LCA(u,v) AC代码: #inc ...
Flink架构（二）- Flink中的数据传输
2. Flink中的数据传输在一个运行的application中,它的tasks在持续交换数据.TaskManager负责做数据传输.TaskManager的网络组件首先从缓冲buffer中收集re ...
关于BaiduPSC-Go的一些bug的更正
首先说下操作步骤下载是在GutHub,这个不赘述,网上很多资料下载之后配置环境变量,在path的后面加上一个分号,然后加上你下载的目录,目录名最好为英文然后通过命令行CMD工具,输入BaiduP ...
Python多线程join/setDaemon
import threading, time class Test(): def test1(self): print("--") time.sleep(3) print(&quo ...
jmeter的使用---JDBC
一.数据库连接配置JDBC Connection Configuration 二.执行sql语句select statement (1)query type类型介绍 select statement: ...
安装mongo以及相关扩展
背景:看到了一个nodejs的对mongo操作的课程,于是想学一下. * 1.于是打算先在自己的vps上安装一个mongodb:[ https://docs.mongodb.org/manual/tu ...
python evel()的用法
老生常谈部分: eval(expression[, globals[, locals]]) expression -- 表达式. globals -- 变量作用域,全局命名空间,如果被提供,则必须是一 ...
[Excel] 一些实用的函数式子
这次是用php写了一个系统收集信息,需要身份证号作为验证,但是为了信息安全只能在数据库里面放身份证后六位.也就是说.最终导出的Excel也是只有身份证的后六位.,, 后来我发现我本地保存的完整身份 ...
Bug搬运工-CSCux99539：Intermittent error message "Power supply 2 failed or shutdown"
Description Symptom:Following error messages will be seen intermittently.%PFMA-2-PS_FAIL: Power supp ...
【SSH】spring 整合 hibernate
spring-hibernate-1.2.9.jar applicationContext.xml <bean id="sessionFactory" class=" ...

pandas read excel or csv

pandas read excel or csv的更多相关文章

随机推荐

热门专题