.read_table() / read_csv()  
  filepath_or_buffer 文件路径
sep=’\t’ 分隔符. 设置为N, 将尝试自动确定
delimiter=N sep的备用参数名
header='infer' int 用作列名称的行号
ints 若传入列表则表示这几行都将作为列标签
None 文件中不包含标题行
'infer' header = 0 if name is None else None
names=N 作为列标签的列表
index_col=N int 用作行标签的列
序列 使用MultiIndex
F 强制使用第一列作为索引
usecols=N list_like: 要读取的列, 位置或列标签
squeeze=F 若果解析的数据只有一列, 则返回一个Series
prefix=N 在没有标题时添加到列号的前缀,例如'X'代表X0,X1,...
mangle_dupe_cols=T 重复的列将被指定为”X”, "X.1"...“X.N”. 传入F将导致覆盖数据
dtype=N 数据或每列数据类型. 例如:{'a':np.float64,'b':np.int32}
engine=N 选择解析器引擎. ‘c’引擎速度更快,而’python’引擎目前更加完善
converters=N dict {key:fun(str)}. 转换某些列中的值的函数, 键是整数或列标签
true_values=N list. 要考虑的值为True   ???
false_values=N list. 要考虑的值为False   ???
skipinitialspace=F 跳过分隔符后的空白符
skiprows=N 要跳过的行号(list)或要跳过的行数(integer)
nrows=N 要读取的文件的行数. 适用于读取大文件的片段
na_values=N 识别为NaN的字符串或字符串列表
keep_default_na=T T设置的na_values追加到默认识别为NaN值的列表, 否则将覆盖默认
na_filter=T 是否检测Na值, 在确定没有Na的数据中设置为F可提高读取大文件的性能
verbose=F 是否显示每一列中的NA值的数量
skip_blank_lines=T 如果为T, 则跳过空白行, 而不是解释为NaN值
parse_dates=F True: 尝试将索引解析成日期
[位置或标签]: 尝试将这些列解析成日期
[[位置或标签]]: 合并这些列并尝试将其解析成日期
{name: [位置或标签]}: 合并指定列指定标签为name, 并尝试将其解析为日期
infer_datetime_format=F True: 尝试加快parse_dates解析速度
keep_date_col=F True: 若parse_dates解析成的日期列没有占用原数据标签, 则保留原始列
date_parser=N 用于将字符串转换为datetime的函数, 默认dateutil.parser.parser
dayfirst=F True: 识别欧洲格式日期(日-月-年), 默认将识别为(月-日-年)
iterator=F 生成迭代器, 通过迭代或get_chunk()获取数据块(默认全部)
chunksize=N int: 生成迭代器, 通过迭代或get_chunk()每次获取此参数指定大小的数据块
compression='infer' {'infer','gzip','bz2','zip','xz',None}  用于磁盘上数据的即时解压缩。如果“infer”,则使用gzip,bz2,zip或xz,如果filepath_or_buffer是分别以“.gz”, “.bz2”, “.zip”或“xz”结尾的字符串,否则不进行解压缩。如果使用'zip',ZIP文件必须只包含一个要读入的数据文件. 设置为无, 无解压缩
thousands=N str: 千位分隔符, 默认无
decimal='.' 可识别为小数点的字符
lineterminator=N str(length 1) 将文件拆分成行的字符, 只有C解释器有效
quotechar='"' str(length 1) 用于表示带引号项目的开始和结束的字符. 引号项可以包含分隔符, 它将被忽略
quoting=0 3: quotechar参数将不会生效
escapechar=N ???
comment=N str(length 1) 以此字符开头的行将被当做空白行处理
encoding=N 编码
dialect=N ???
tupleize_cols=F 当选择多行作为列标签时, 默认生成多级索引, 若设置为True, 则会把多个索引组成元组作为单个标签
error_bad_lines=T False: 异常行将被删除
warn_bad_lines=T error_bad_lines为False, 且此参数为True, 将会输出每一个error行的警告
skipfooter=0 跳过文件底部的行数(不支持engine ='c')
skip_footer=0 弃用, 使用skipfooter参数
doublequote=T 将连续多个quotechar指定的字符当做一个来识别
delim_whitespace=F 指定是否将空白用作分隔符, 相当于设置sep='\s+'. 若设为True, 则不应为delimiter参数传入任何内容(支持Python解释器)
compact_ints=F 将被删除
use_unsigned=F 将被删除
low_memory=T ???
buffer_lines=N 将被删除
memory_map=F 如果为filepath_or_buffer提供了文件路径,则将文件对象直接映射到内存上,并从中直接访问数据。使用此选项可以提高性能,因为不再有任何I / O开销
float_precision=N ???
.read_fwf() 读取固定宽度格式的文件
     
.read_msgpack() ???
     

#s3gt_translate_tooltip_mini { display: none !important }

python库--pandas--文本文件读取的更多相关文章

  1. 三、Python系列——Pandas数据库读取数据

    Pandas主要先读取表格类型的数据,然后进行分析. import pandas as pd# 由于是用pandas模块操作数据,因此不用在路径前加open,否则就是python直接打开文件,可能还会 ...

  2. python库pandas

    由于在机器学习中经常以矩阵的方式来表现数据,那么我们就需要一种数据结构来存储和处理矩阵.pandas库就是这样一个工具. 本文档是一个学习笔记,记录一些常用的命令,原文:http://www.cnbl ...

  3. python库pandas简介

    pandas是基于numpy的数据分析模块,提供了大量标准模型和高效操作大型数据集所需要的工具. pandas主要提供了3种数据结构:1.Series,带标签的一维数组:2.DataFrame,带标签 ...

  4. Python库-Pandas

    Pandas是基于NumPy的一种数据分析工具,提供了大量使我们快速便捷处理数据的函数和方法. 中文官网地址:https://www.pypandas.cn Pandas基于两种数据类型:Series ...

  5. python 【pandas】读取excel、csv数据,提高索引速度

    问题描述:数据处理,尤其是遇到大量数据且需要for循环处理时,需要消耗大量时间,如代码1所示.通过data['trip_time'][i]的方式会占用大量的时间 代码1 import time t0= ...

  6. 顶级Python库

    绝不能错过的24个顶级Python库 Python有以下三个特点: · 易用性和灵活性 · 全行业高接受度:Python无疑是业界最流行的数据科学语言 · 用于数据科学的Python库的数量优势 事实 ...

  7. Python数据分析库pandas基本操作

    Python数据分析库pandas基本操作2017年02月20日 17:09:06 birdlove1987 阅读数:22631 标签: python 数据分析 pandas 更多 个人分类: Pyt ...

  8. Python 数据处理库 pandas 入门教程

    Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...

  9. 教程 | 一文入门Python数据分析库Pandas

    首先要给那些不熟悉 Pandas 的人简单介绍一下,Pandas 是 Python 生态系统中最流行的数据分析库.它能够完成许多任务,包括: 读/写不同格式的数据 选择数据的子集 跨行/列计算 寻找并 ...

  10. Python 数据处理库pandas教程(最后附上pandas_datareader使用实例)

    0 简单介绍 pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程. pandas提供了快速,灵活和富有 ...

随机推荐

  1. DNS服务器(一)正向解析

    一.DNS简介 在日常生活中人们习惯便用域名访问服务器,但机器间互相只认IP地址,域名与1P地址之间是多对一的关系,一个ip地址不一定只对应一个域名,且一个域名只可以对应一个ip地址,它们之间的转换工 ...

  2. 记一次WindowsServer2012提权 - 烂土豆

    此次主题:烂土豆 shell咋拿的 我也忘了 好像是添加友情链接那里还是啥 不重要了 直接获取shell后 先用systeminfo > 1.txt了一下 然后放到了 windows-explo ...

  3. Git点赞82K!字节跳动保姆级Android学习指南,干货满满

    这是一份全面详细的<Android学习指南>,如果你是新手,那么下面的内容可以帮助你找到学习的线路:如果你是老手,这篇文章列出的内容也可以帮助你查漏补缺.如果各位有什么其他的建议,欢迎留言 ...

  4. 面试了一位33岁Android程序员,只会面向百度编程,居然要25k,脸呢?

    最近逛论坛看到这样一个帖子: 面试了一位工作12年的程序员, 这位老哥有3年java开发经验,2年H5,7年Android开发经验,简历上写着精通Java,Android,熟悉H5开发.没有具体的技术 ...

  5. git根据项目地址使用不同代理服务器

    问题 由于公司访问GitHub只能走代理,但是内网gitlab服务器又不能走代理. 因此想找到一种方案,可以支持git自动根据项目地址使用不同代理. 方案 如下所示,可以指定GitHub地址使用指定的 ...

  6. Layui-自定义函数及调用

    控件 表格 时间范围 页面展示 场景 页面中选择开始时间和结束时间表格变化 使用 html代码 <div> <form class="layui-form" ac ...

  7. Windows内核基础知识-1-段寄存器

    Windows内核基础知识-1-段寄存器 学过汇编的应该都知道段寄存器,在Windows里段寄存器有很多,之前可能只接触了ds数据段,cs 代码段这种,今天这个博客就介绍Windows一些比较常用的段 ...

  8. Liunx搭建Rlogin服务

    实验环境为 centos7 第一步:安装服务:yum -y install rsh rsh-server xinetd  第二步:启动服务: systemctl restart rsh.sockets ...

  9. 题解 queen(留坑)

    传送门 博客园突然打不开了,奇奇怪怪的-- 少写个等号没看出来 nm写反了没看出来 考完5min全拍出来了 手残属性加持 不对拍等于爆零 yysy,我连卢卡斯定理的存在都忘了-- 发现要让一大堆皇后能 ...

  10. 分布式文件系统FastDFS搭建实操

    转载---------佳先森--- 一.什么是文件系统 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节 ...