1 pandas简介

1.Pandas是什么？

Pandas是一个强大的分析结构化数据的工具集；

它的使用基础是Numpy（提供高性能的矩阵运算）；

用于数据挖掘和数据分析，同时也提供数据清洗功能。

2.DataFrame

DataFrame是Pandas中的一个表格型的数据结构，包含有一组有序的列，每列可以是不同的值类型(数值、字符串、布尔型等)，DataFrame即有行索引也有列索引，可以被看做是由Series组成的字典。

pandas 相当于 python 中 excel：它使用表（也就是 dataframe)，能在数据上做各种变换，但还有其他很多功能。

class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

参数	意义	数据结构
data	需要被转换的数据	ndarray (structured or homogeneous), Iterable, dict, or DataFrame
index	设置行索引	Index or array-like
columns	设置列名	Index or array-like
dtype	设置数据类型	dtype, default None
copy	备份数据	boolean, default False

3.Series

它是一种类似于一维数组的对象，是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。

4.pandas 网址

官网：https://pandas.pydata.org/

中文网：https://www.pypandas.cn/

2 导入

符号	含义
df	二维的表格型数据结构DataFrame
s	一维数组Series （一个一维的标签矩阵）

还需要执行以下导入才能开始：

import pandas as pd

import numpy as np

3 使用

# 使用Pandas

>>> import pandas as pd

>>> df = pd.DataFrame()

>>> print(df)

# 输出结果

Empty DataFrame

Columns: []

Index: []

4 读取、写入

import pandas as pd

df = pd.read_excel("D:/项目/资料/People.xlsx")     # 把文件读到内存中形成DataFrame

print(df.shape)     # 读取文件行数和列数

print(df.columns)   # 读取列名

print(df.head(3))   # 打印前3行

print(df.tail(3))   # 打印后3行

df = pd.DataFrame({"ID":[1,2,3],"Name":["jack","小明","小红"]})

df = df.set_index("ID")     # 把ID那一列当索引，并产生新的DataFrame

df.to_excel("D:/项目/我爱你.xlsx")   # 写入文件

print("Done！")

Python数据分析：pandas玩转Excel （一）的更多相关文章

Python数据分析--Pandas知识点(三)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) Python数据分析--Pandas知识点(二) 下面将是在知识点一, ...
Python数据分析--Pandas知识点(二)
本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) 下面将是在知识点一的基础上继续总结. 13. 简单计算新建一个数据表 ...
用Python的pandas框架操作Excel文件中的数据教程
用Python的pandas框架操作Excel文件中的数据教程本文的目的,是向您展示如何使用pandas 来执行一些常见的Excel任务.有些例子比较琐碎,但我觉得展示这些简单的东西与那些你可以在其 ...
【Python数据分析】Python3操作Excel(二) 一些问题的解决与优化
继上一篇[Python数据分析]Python3操作Excel-以豆瓣图书Top250为例对豆瓣图书Top250进行爬取以后,鉴于还有一些问题没有解决,所以进行了进一步的交流讨论,这期间得到了一只尼玛 ...
Python数据分析-Pandas（Series与DataFrame）
Pandas介绍: pandas是一个强大的Python数据分析的工具包,是基于NumPy构建的. Pandas的主要功能: 1)具备对其功能的数据结构DataFrame.Series 2)集成时间序 ...
Python数据分析：pandas玩转Excel （二）
1 对Excel文件的操作方法一: 使用xlrd库或者xlwt库进行对excel表格的操作读与写: 方法二: pandas库同样支持excel的读写操作:且更加简便. 2 pd.read_excel ...
Python数据分析：pandas玩转Excel（三）
将对象写入Excel工作表. 要将单个对象写入 Excel .xlsx 文件,只需指定目标文件名即可.要写入多个工作表,必须创建具有目标文件名的ExcelWriter对象,并在文件中指定要写入的工作表 ...
python 数据分析--pandas
接下来pandas介绍中将学习到如下8块内容:1.数据结构简介:DataFrame和Series2.数据索引index3.利用pandas查询数据4.利用pandas的DataFrames进行统计分析 ...
Python数据分析Pandas库方法简介
Pandas 入门 Pandas简介背景:pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的使用既简单又直观.它旨在成为在Python中进行实际, ...

随机推荐

基于TCP的客户端和服务器端的代码设计
实验平台 linux 实验内容编写TCP服务器和客户端程序,程序运行时服务器等待客户端连接.一旦连接成功,服务器显示客户端的IP地址和端口号,并向客户端发送字符串实验原理 TCP是面向连接的通信, ...
题解 CF588A 【Duff and Meat】
题意有一个人,想吃 $n$ 天肉,第 $i$ 天需要吃 $a[i]$ 块肉,第 $i$ 天超市肉价为每块 $b[i]$ 元,买来的肉可以留到后面吃,求这个人在每天都吃到肉的情况下花费的最小值. 题目 ...
【Elasticsearch学习】之基础概念
Elasticsearch是一个近实时的分布式搜索引起,其底层基于开源全文搜索库Lucene:Elasticsearch对Lucene进行分装,对外提供REST API 的操作接口.基于 ES,可以快 ...
DVWA-对Command Injection(命令注入)的简单演示与分析
前言上一篇文章中,对命令注入进行了简单的分析,有兴趣的可以去看一看,文章地址 https://www.cnblogs.com/lxfweb/p/12828754.html,今天这篇文章以DVWA的C ...
最长递增子序列(Longest increasing subsequence)
问题定义: 给定一个长度为N的数组A,找出一个最长的单调递增子序列(不要求连续). 这道题共3种解法. 1. 动态规划动态规划的核心是状态的定义和状态转移方程.定义lis(i),表示前i个数中以A[ ...
P1750 出栈序列
这好像是普及难度的吧~ 感觉再次被小学生吊打了........ \(\color{Red}{----------------------=|(●'◡'●)|=我是手动的分割线------------- ...
【BIM】BIMFACE中实现电梯实时动效
背景在运维场景中,电梯作为运维环节重要的一部分是不可获缺的,如果能够在三维场景中,将逼真的电梯效果,包括外观.运行状态等表现出来,无疑是产品的一大亮点.本文将从无到有介绍如何在bimface中实现逼 ...
stanfordcorenlp安装教程&问题汇总（importerror-no-module-named-psutil、OSError: stanford-chinese-corenlp-yyyy-MM-dd-models.jar not exists.）&简单使用教程
stanfordcorenlp安装教程&简单使用教程编译环境:python 3.6 .win10 64位.jdk1.8及以上 1.stanfordcorenlp安装依赖环境下载安装JDK ...
python工业互联网应用实战1—SQL与ORM
从sql到ORM应该说也是编程体系逐步演化的结果,通过类和对象更好的组织开个过程中遇到的各种业务问题,面向对象的解耦和内聚作为一套有效的方法论,对于复杂的企业应用而言确实能够解决实践过程中很多问题. ...
Mysql 常用函数（10）- strcmp 函数
Mysql常用函数的汇总,可看下面系列文章 https://www.cnblogs.com/poloyy/category/1765164.html strcmp 的作用比较两个字符串的顺序是否完全 ...