最近在公司在弄数据分析相关的项目,数据分析就免不了要先对数据进行处理,也就自然避不开关于excel文档的初始化操作了。

一段时间之后,发现pandas更加符合我的项目要求,所以,将一些常规操作记录下来,便于以后查阅。

那在开始下面的操作之前,下载pandas模块是很有必要的

文件打开

首先在刚开始的时候需要导入模块pandas

import pandas as pd

pandas的打开文件一共有三种方法,分别对应三种文件,即:

数据类型 说明 Pandas读取方式
csv,tsv,txt 用逗号分割,tab分割的纯文本文件 pd.read_csv
excel 微软xls或者xlsx文件 pd.read_excel
mysql 关系型数据库表 pd.read_sql

我现在的工作需求中,现阶段最常用的是.xlsx的文件读取

.xlsx文件打开

df = pd.read_excel('1.xlsx') # 文件名或文件路径
print(df)
         id                                         enterprise
0 18950 中国农业大学资源与环境学院
1 18949 山东恒丰农业科技有限公司
2 18948 石家庄市民丰种子有限公司、北京中农臻中农业科技发展有限公司
3 18947 九原区种子有限责任公司
4 18946 中国农业大学和武汉隆福康农业发展有限公司
... ... ...
6215 12735 浙江省农业科学院与核技术利用研究所、湖州科奥种业有限公司
6216 12734 浙江省农科院作核所、杭州市种子技术推广站
6217 12733 浙江省农业科学院作核所、湖州市种子公司
6218 12732 浙江省农科院作核所、杭州市种子公司
6219 12731 浙江省农业科学院作物与核技术利用研究所、宁波市农业科学研究院生物技术研究所、浙江之豇种业有限... [6220 rows x 2 columns]

这样就读取了.xlsx类型的文件

文件读取

.shape

有些时候我只是想看看这个表的尺寸大约是多大的,就可以用这个方法

df.shape
(6220, 2)

该方法会返回这个表的(行数,列数)

.columns

有些时候我想看看这个表的标题,就是第一行的信息

df.columns
Index(['id', 'enterprise'], dtype='object')

该方法会返回一个列表形式的数据

.head()

当然,有些时候也不需要那么多的数据读取,可能有些时候只想读取前几行

该方法会默认的读取数据的前5行数据

    def head(self: FrameOrSeries, n: int = 5) -> FrameOrSeries:
df.head()
      id                     enterprise
0 18950 中国农业大学资源与环境学院
1 18949 山东恒丰农业科技有限公司
2 18948 石家庄市民丰种子有限公司、北京中农臻中农业科技发展有限公司
3 18947 九原区种子有限责任公司
4 18946 中国农业大学和武汉隆福康农业发展有限公司

当然也可以修改读取的行数

df.head(10)

.index

读取数据的时候,也许发现了,在最左侧有一列数据,他本不是在数据当中的数据,这一列就是数据的索引,就像数据库当中的id一样

那可以通过这个方法来查看索引列

df.index
RangeIndex(start=0, stop=6220, step=1)

1.pandas打开和读取文件的更多相关文章

  1. 分享:Perl打开与读取文件的方法

    在Perl中可以用open或者sysopen函数来打开文件进行操作,这两个函数都需要通过一个文件句柄(即文件指针)来对文件进行读写定位等操作. Perl打开与读取文件的方法,供大家学习参考.本文转自: ...

  2. pandas模块之读取文件

    首先我们来看一个文件 1 男 北京 刘一 我笑 #跳过此行,序号1 2 女 上海 刘珊 你笑 3 男 杭州 刘五 他笑 #跳过此行,序号四 4 女 重庆 刘六 不笑了 下面来分析内容,并使用参数 1 ...

  3. java io流(字符流) 文件打开、读取文件、关闭文件

    java io流(字符流) 文件打开 读取文件 关闭文件 //打开文件 //读取文件内容 //关闭文件 import java.io.*; public class Index{ public sta ...

  4. pandas.read_csv()函数读取文件时,关于“header=None”影响读取列数区间的右闭合总结

    对于一个没有字段名标题的数据,如data.csv 1.获取数据内容.pandas.read_csv("data.csv")默认情况下,会把数据内容的第一行默认为字段名标题. imp ...

  5. Groovy读取文件信息

    1. eachLine -- 打开和读取文件的每一行 new File("foo.txt").eachLine { println it.toUpperCase(); } 2. r ...

  6. Pandas读取文件

    如何使用pandas的read_csv模块以及其他读取文件的模块?? 一起来看一看 Pandas中read_csv和read_table的区别 注:使用pandas读取文件格式为pandas特有的da ...

  7. python 文件的打开与读取

    python 文件的打开与读取 其实网上其他人写的都挺好的,我也是看他们的.办公室用的2.7.笔记本用的3.6.发现没有file 类,尴尬了 with open(r'C:\Users\HBX\Docu ...

  8. Python文件操作:文件的打开关闭读取写入

    Python文件操作:文件的打开关闭读取写入 一.文件的打开关闭 Python能以文本和二进制两种方式处理文件,本文主要讨论在Python3中文本文件的操作. 文件操作都分为以下几个步骤: 1.打开文 ...

  9. python 读取文件夹中所有同类型的文件 并用pandas合并

    import globimport osimport pandas as pd read_path = 'D:/Data' # 要读取的文件夹的地址read_excel = glob.glob(os. ...

随机推荐

  1. Vue基础篇 (1) —— Vue-Router的使用

    Vue-Cli中Vue-Router的使用 一.创建vue-cli的项目 npm create myproject vue create 为vue.js 3.0构建项目的命令,2.0版本可以通过vue ...

  2. Python实用笔记 (15)函数式编程——装饰器

    什么函数可以被称为闭包函数呢?主要是满足两点:函数内部定义的函数:引用了外部变量但非全局变量. python装饰器本质上就是一个函数,它可以让其他函数在不需要做任何代码变动的前提下增加额外的功能,装饰 ...

  3. 吐血推荐,想进BAT必看

    不必太纠结于当下,也不必太忧虑未来,人生没有无用的经历,当你经历过一些事情后,眼前的风景已经和从前不一样了.--村上春树 一.包含如下内容 ActiveMQ消息中间件面试专题 BAT80道面试题 BA ...

  4. IDEA 2020.1 插件市场无法找到官方的汉化包解决办法

    问题: idea 终于更新了2020.1版本,新增了好多的特性,官方也终于支持了中文语言包,但是下载后在插件市场无法找到官方的汉化包 解决: 去IDEA插件中心 (https://plugins.je ...

  5. 《UNIX环境高级编程》(APUE) 笔记第三章 - 文件I/O

    3 - 文件I/O Github 地址 1. 文件描述符 对于内核而言,所有打开的文件都通过 文件描述符 (file descriptor) 引用.当打开一个现有文件或创建一个新文件时,内核向进程返回 ...

  6. 四. sql上线平台

    一.inception安装使用 inception是一个集审核.执行.备份及生成回滚语句于一身的MySQL自动化运维工具 [root@CentOS ~]# [root@CentOS ~]# wget ...

  7. C++ 简单的UDP客户端与服务端

    .h #pragma once #ifndef __C_UDP_OBJECT_H__ #define __C_UDP_OBJECT_H__ #define OS_PLATFORM_WIN #inclu ...

  8. 读取模式下cbc latch的事件模拟(热块竞争和热链竞争)-P62

    文章目录 1. 背景 2. 过程 2.1 热块竞争 2.1.1 版本11.2.0.1.0 2.1.1.1 session 1(sid:34) 2.1.1.2 session 2(sid:35) 2.1 ...

  9. cf1216E2 Numerical Sequence (hard version)(思维)

    cf1216E2 Numerical Sequence (hard version) 题目大意 一个无限长的数字序列,其组成为\(1 1 2 1 2 3 1.......1 2 ... n...\), ...

  10. Howdoo欢迎Mitel成为内容发布支持者

    原文链接:https://medium.com/howdoo/howdoo-welcomes-mitel-as-a-launch-supporter-4c40027d4dd1 “Mitel很高兴能够成 ...