2018.03.29 python-pandas 数据读取
#数据读取
# read_table,read_csv,read_excel
#读取普通分隔数据:read_table
#可以读取txt,csv
import os
import pandas as pd
os.chdir(r'C:\Users\BRIGHT-SH-002\Desktop\python') data1 = pd.read_table('data1.csv',delimiter=',',header=0)
print(data1)
data1 = pd.read_table('data1.csv',delimiter=',',header=0,index_col=0)
print(data1)
#delimiter:用于拆分的字符,也可以用sep:sep=','
#header:用做列名的序号,默认为0(第一行)
#index_col:指定将某烈为行索引,否则自动索引0,1 (作为索引列) #read_table主要用于读取简单的数据 txt/csv
结果:
va1 va2 va3 va4
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
va2 va3 va4
va1
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7
# 读取csv数据:read_csv
# 先熟悉一下excel怎么导出csv
data2 = pd.read_csv('data2.csv',engine='python')
print(data2.head())
#engine:使用的分析引擎,可以选择C或者python。 C引擎快但是python引擎更加完备
#encoding:指定字符集类型,即编码,通常指定'utf-8'
print(type(data2))
#大多数情况先将excel导出csv,再读取
#读取excel数据:read_excel
data3 = pd.read_excel('test.xlsx',sheet_name='test1',header=0)
print(data3.head())
#io:文件路径
#sheet_name:返回多个表用sheet_name=[0,1],若sheet_name=None是返回全表
#-> 1.int/string 返回的是dataframe 2.而None和list返回的是dict
#header:指定列名行,默认0,取第一行
#index_col:指定列为索引列,也可以使用:'strings'
2018.03.29 python-pandas 数据读取的更多相关文章
- 2018.03.27 python pandas merge join 使用
#2.16 合并 merge-join import numpy as np import pandas as pd df1 = pd.DataFrame({'key1':['k0','k1','k2 ...
- 重拾Python(5):数据读取
本文主要对Python如何读取数据进行总结梳理,涵盖从文本文件,尤其是excel文件(用于离线数据探索分析),以及结构化数据库(以Mysql为例)中读取数据等内容. 约定: import numpy ...
- pandas数据读取(DataFrame & Series)
1.pandas数据的读取 pandas需要先读取表格类型的数据,然后进行分析 数据说明 说明 pandas读取方法 csv.tsv.txt 用逗号分割.tab分割的纯文本文件 pd.read_csv ...
- Pandas 数据读取
1.读取table # 读取普通分隔数据:read_table # 可以读取txt,csv import os os.chdir('F:/') #首先设置一下读取的路径 data1 = pd.read ...
- 2018.03.29 python-pandas 数据透视pivot table / 交叉表crosstab
#透视表 pivot table #pd.pivot_table(data,values=None,index=None,columns=None, import numpy as np import ...
- pandas数据读取
02. Pandas读取数据 本代码演示: pandas读取纯文本文件 读取csv文件 读取txt文件 pandas读取xlsx格式excel文件 pandas读取mysql数据表 1.读取纯文本文件 ...
- 2018.03.29 python-matplotlib 图表生成
'''Matplotlib -> 一个python版的matlab绘图接口,以2D为主,支持python,numpy,pandas基本数据结构,高效图标库''' import numpy as ...
- 2018.03.29 python-pandas transform/apply 的使用
#一般化的groupby方法:apply df = pd.DataFrame({'data1':np.random.rand(5), 'data2':np.random.rand(5), 'key1' ...
- python + Excel数据读取(更新)
data.xlsx 数据如下: import xlrd#1.读取Excel数据# table = xlrd.open_workbook("data.xlsx","r&qu ...
随机推荐
- 爬虫笔记八——Scrapy实战项目
(案例一)手机App抓包爬虫 1. items.py import scrapy class DouyuspiderItem(scrapy.Item): # 存储照片的名字 nickName = sc ...
- linux vps定时备份网站、数据库命令sh
vps定时备份数据库命令,将下面的代码保存为backsql.sh,然后设置定时任务运行即可. cd /home/admin/backup #切换到备份目录 btimes=$(date +%y%m%d% ...
- maven参数详解
setting.xml主要用于配置maven的运行环境等一系列通用的属性,是全局级别的配置文件:而pom.xml主要描述了项目的maven坐标,依赖关系,开发者需要遵循的规则,缺陷管理系统,组织和li ...
- rediscli命令
一.rediscli xxx 发送命令 二.进入客户端后的命令
- 关于 html button 点击刷新页面的问题
如果不想点击button 刷新页面的话,需要加个属性 type="button" 如下: <button class="layui-btn" type ...
- python selenium 相关操作
selenium : 是一个用于Web应用程序测试的工具.Selenium测试直接运行在浏览器中,就像真正的用户在操作一样.支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Fi ...
- DB2的HADR
db2stop force; db2start; db2 restore db clmsdb; db2 start hadr on db clmsdb as standby; ************ ...
- C#对应JavaScript的银行家舍入规则(Math.Round()对应toFixed(f))
Math.Round((n * u - t * u )/ u, f);//这里使用银行家四舍五入对应JS的 toFixed() ((n * u - t * u) / u).toFixed(f) f为小 ...
- CF1263F
题目描述 给出一个类似这样 的图,求删掉最多的黑边使得每个特殊点和至少一个节点1连通 保证上下两棵树都存在一种dfs序使得访问特殊点的顺序为1~n 题解 设f[i][j]表示上面的树最后一个特殊点为i ...
- 实战build-react(三)
安装 redux-thunk yarn add redux-thunk 或 npm install redux-thunk --save https://github.com/zalmoxisus/r ...