pandas-pd.read_csv
read_csv()接受以下常见参数:
| 参数 | 中文名 | 参数类型 | 默认参数 | 参数功能 | 说明 |
| filepath_or_buffer | various |
:文件路径、URL、或者 是read()函数返回的对象 |
|||
| sep | 指定分隔符 | str | 默认是',' | ||
| delimiter | 定界符 | str | 默认是None | 指定该参数,sep失效 | |
| delim_whitespace | boolean | 默认是False | 指定空格或者'\t'是否作为分隔符使用 | 如果该参数指定为True,则delimiter失效 | |
| header | 指定行号用于列名,默认指定是第0行作为列名。如果没有列名,则显式指定header = None | ||||
| names | 默认是None | 如果表格中没有列名,就显式指定header = None,然后由names= ["xx","xx"]指定列名。 | |||
| index_col | int or sequence or False | 默认是None | 用作行索引的列编号或者列名 | 当设定index_col = False时,强制pandas不使用第一个列作为行名 | |
| usecols | list-like 或者callable | 默认是None | 返回列的子集,就是你可以指定哪些列返回,比如usecols = [1,3,5]或者usecols = [' xx','xx'] xx是列名 | 输入0、1这种数字则顺序就没了,若想保留列的顺序,就输入列名。 | |
| squeeze | boolean | 默认是False | 如果只包含一列,则设置为True,会返回一个Series. | ||
| prefix | str | 默认是None | 在没有列标题时,用来给列添加前缀。 | 比如prefix = 'xx',则列名就是xx0,xx1,xx2.... | |
| mangle_dupe_cols | boolean | 默认是True | 将列名重复的列,更名为X.0,X.1,X.2.. | 如果设置为False,则覆盖所有重名列。 | |
| dtype | type | 默认是None | 指定每列数据的类型 | dtype = {‘a’:np.float64,'b':np.int32} | |
| skiprows | list-like或者interger | 默认是None | 跳过指定的行 | skiprows = [1,2,3,4] or skiprows = lambda x :x%2 !=0 | |
| skipfooter | int | 默认是0 | 从底部跳过的行 | skiprows = [1,2,3]从尾部忽略123行 | |
| nrows | int | 默认是None | 需要读取的行数 | nrows = [1,2,3]从头部读取123行 | |
| na_values | scalar或者str或者list-like | 默认是NOne | 用于替换NA/NaN的值 | ||
| memory_map | boolean | 默认是False | 如果filepath是filepath_or_buffer,则直接将其映射到内存 | ||
| keep_default_na | boolearn | 默认是True | 与na_values搭配使用, | ||
| na_values | |||||
| na_filter | boolean | 默认是True | 如果设置为False,则不检查有无空值,提高速度 | ||
| verbose | boolean | 默认是False | 指示替代非数字列的NA的数量 | ||
| skip_blank_lines | boolean | 默认是True | 如果是True则跳过空白行,为False则空白行用NaN替代。 | ||
| encoding | str | 默认是None | encoding = 'utf-8' | ||
参考网址:https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#io-read-csv-table
建议还是看英文介绍,详细
pandas-pd.read_csv的更多相关文章
- pd.read_csv() 、to_csv() 之 常用参数
本文简单介绍一下read_csv()和 to_csv()的参数,最常用的拿出来讲,较少用的请转到官方文档看. 一.pd.read_csv() 作用:将csv文件读入并转化为数据框形式. pd.read ...
- pandas的read_csv函数
pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, ...
- pd.read_csv的header用法
默认Header = 0: In [3]: import pandas as pd In [4]: t_user = pd.read_csv(r'C:\Users\Song\Desktop\jdd_d ...
- [Python Study Notes]pd.read_csv()函数读取csv文件绘图
''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''' ...
- pd.read_csv参数解析
对pd.read_csv参数做如下解释: pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', n ...
- (转)pd.read_csv之OSError: Initializing from file failed的解决方案
转:https://blog.csdn.net/funnyPython/article/details/78532102 rides = pd.read_csv(data_path)1 # OSErr ...
- pandas的read_csv踩到的坑
read_csv要注意,如果没有设置index_col时,读出来的会在索引上方加上Unnamed:0.可以通过设置index_col来解决这个问题. import pandas as pd impor ...
- 使用read、readline、readlines和pd.read_csv、pd.read_table、pd.read_fwf、pd.read_excel获取数据
从文本文件读取数据 法一: 使用read.readline.readlines读取数据 read([size]):从文件读取指定的字节数.如果未给定或为负值,则去取全部.返回数据类型为字符串(将所有行 ...
- 详解pandas的read_csv方法
楔子 使用pandas做数据处理的第一步就是读取数据,数据源可以来自于各种地方,csv文件便是其中之一.而读取csv文件,pandas也提供了非常强力的支持,参数有四五十个.这些参数中,有的很容易被忽 ...
- pd.read_csv操作读取分隔符csv和text文件
pandas.read_csv可以读取CSV(逗号分割)文件.文本类型的文件text.log类型到DataFrame 1. pandas.read_csv常用参数整理 也支持文件的部分导入和选择迭代 ...
随机推荐
- pytest-skip详解
import pytestimport sysenvironment='android' #设置系统变量为android @pytest.mark.skipif(environment==" ...
- Win7下设置一键关闭所有程序的功能
(文章仅作个人整理和笔记) 在很多情况下,上班族发生这种情况的比较多吧,忙碌的一天下来,准备下班走人的时候,发现自己的电脑打开了好多程序,需要一个一个去关闭,那么有没有什么方法可以实现一键快速关闭所有 ...
- Socket网络编程--初级
如果想开发一个基于TCP/IP协议的网络程序,应用程序之间则主要通过Socket交换数据 .NET Socket支持四种编程模式 1.居于阻塞模式的Socket编程 2.”非阻塞“模式的Socket编 ...
- NFS(网络文件系统)
NFS(网络文件系统) 1.关于NFS介绍 1.1NFS在企业中的应用场景 在企业集群架构的工作场景中,NFS网络文件系统一般被用来存储共享视频,图片,附件等静态资源文件,通常网站用户上传的文件都会放 ...
- Feign实现服务调用
上一篇博客我们使用ribbon+restTemplate实现负载均衡调用服务,接下来我们使用feign实现服务的调用,首先feign和ribbon的区别是什么呢? ribbon根据特定算法,从服务列表 ...
- 40th 要掀桌子么 还是尬坐吧
今日学习精华: 面向对象编程里面有一句 非常经典的描述:-----通过类实例化一个对象,通过对象调方法----- 注意:对象调用的 方法 ,即 函数一定要有 参数 def ...
- Spring boot ----RestTemplate学习笔记
****spring boot-----restTemplate 封装了HttpURLConnection,HttpClient,Netty等接口访问实现库 restTemplet包含以下部分 Htt ...
- hive之基本架构
什么是Hive hive是建立在Hadoop体系架构上的一层SQL抽象,使得数据相关人员是用他们最为熟悉的SQL语言就可以进行海量的数据的处理.分析和统计工作,而不是必须掌握JAVA等变成语言和具备开 ...
- mysql 日期函数大全
对于每个类型拥有的值范围以及并且指定日期何时间值的有效格式的描述见7.3.6 日期和时间类型. 这里是一个使用日期函数的例子.下面的查询选择了所有记录,其date_col的值是在最后30天以内: my ...
- Windows cmd 打开面板
{ 打开控制面板的命令是:“control” 打开控制面板 命令: rundll32.exe shell32.dll,Control_RunDLL 结果: 显示控制面板窗口. 例子: Cal ...