numpy和pandas的基本用法
安装numpy模块
pip install numpy
可以通过导入numpy模块来使用它
import numpy as np
1.创建数组:
a = np.array([1, 2, 3, 4, 5]) # 从列表创建一维数组
b = np.zeros((3, 3)) # 创建一个3x3的全零数组
c = np.ones((2, 2)) # 创建一个2x2的全一数组
d = np.arange(0, 10, 2) # 从0到10(不包括10),步长为2创建一维数组
2.数组操作:
a.shape # 获取数组的形状
a.ndim # 获取数组的维度
a.size # 获取数组的元素个数
a.dtype # 获取数组的数据类型
a.reshape((2, 3)) # 改变数组的形状
a.min() # 返回数组的最小值
a.max() # 返回数组的最大值
a.sum() # 返回数组的元素和
3.数组运算:
a + b # 数组相加(对应元素相加)
a - b # 数组相减(对应元素相减)
a * b # 数组相乘(对应元素相乘)
a / b # 数组相除(对应元素相除)
np.dot(a, b) # 数组的矩阵乘法
np.sin(a) # 对数组中的每个元素应用sin函数
安装pandas模块
pip install pandas
可以通过导入pandas模块来使用它
import pandas as pd
1.创建和读取数据:
# 从CSV文件读取数据
df = pd.read_csv('data.csv')
# 从excel文件读取数据
data = pandas.read_excel('1.xlsx')
2.数据处理和操作:
# 查看数据头部和尾部
df.head() # 默认显示前5行
df.tail(10) # 显示后10行
# 查看数据统计信息
df.describe() # 显示数值列的统计信息
df['column'].mean() # 计算某一列的平均值
# 选择和过滤数据
df['column'] # 选择某一列
df[['column1', 'column2']] # 选择多列
df[condition] # 根据条件选择行
# 添加和删除数据
df['new_column'] = values # 添加新列
df.drop('column', axis=1, inplace=True) # 删除列
# 数据排序和分组
df.sort_values('column') # 按列值排序
df.groupby('column').mean() # 按列分组并计算平均值
# 处理缺失数据
df.dropna() # 删除包含缺失值的行
df.fillna(value) # 用指定值填充缺失值
3.数据可视化:
df.plot() # 绘制折线图
df.plot(kind='bar') # 绘制柱状图
df.plot(kind='scatter', x='column1', y='column2') # 绘制散点图
小案例(读取excel中的数据进行分析)
import numpy as np
import pandas as pd
df = pd.read_excel('1.xlsx', sheet_name='Sheet1')
# 在read_excel()函数中,1.xlsx是Excel文件的路径,Sheet1是要读取的工作表的名称。可以根据需要更改这些参数。
df.head() # 查看数据前几行
df.shape # 查看数据形状(行数和列数)
df.columns # 查看列名
df['column'] # 选择某一列
df.describe() # 查看数据的统计信息
# 使用NumPy的array()函数将数据转换为NumPy数组(如果需要):
data = np.array(df)
numpy和pandas的基本用法的更多相关文章
- numpy和pandas和matplotlib用法
numpy result = [ [0, 10, 20, 30, 40], [10, 23, 33, 43, 53], [20, 83, 23, 55, 33], [30, 93, 44, 22, 5 ...
- 101道Numpy、Pandas练习题
无论是数据分析还是机器学习,数据的预处理必不可少. 其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推 ...
- python安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...
- 如何快速地从mongo中提取数据到numpy以及pandas中去
mongo数据通常过于庞大,很难一下子放进内存里进行分析,如果直接在python里使用字典来存贮每一个文档,使用list来存储数据的话,将很快是内存沾满.型号拥有numpy和pandas import ...
- numpy、pandas
numpy: 仨属性:ndim-维度个数:shape-维度大小:dtype-数据类型. numpy和pandas各def的axis缺省为0,作用于列,除DataFrame的.sort_index()和 ...
- [转] python安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...
- 1.理解Numpy、pandas
之前一直做得只是采集数据,而没有再做后期对数据的处理分析工作,自己也是有意愿去往这些方向学习的,最近就在慢慢的接触. 首先简单理解一下numpy和pandas:一.NumPy:1.NumPy是高性能计 ...
- numpy和pandas简单使用
numpy和pandas简单使用 import numpy as np import pandas as pd 一维数据分析 numpy中使用array, pandas中使用series numpy一 ...
- Python入门之安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了. 首要条件,python版本必 ...
- python及numpy,pandas易混淆的点
https://blog.csdn.net/happyhorizion/article/details/77894035 初接触python觉得及其友好(类似matlab),尤其是一些令人拍案叫绝不可 ...
随机推荐
- 不是单例的单例——巧用ClassLoader
本文通过如何将一个单例类实例化两次的案例,用代码实践来引入 Java 类加载器相关的概念与工作机制.理解并熟练掌握相关知识之后可以扩宽解决问题的思路,另辟蹊径,达到目的. 背景 单例模式是最常用的设计 ...
- AcWing 3729. 改变数组元素
给定一个空数组 V 和一个整数数组 a1,a2,-,an. 现在要对数组 V进行 n次操作. 第 i次操作的具体流程如下: 从数组 V尾部插入整数 0. 2.将位于数组 V末尾的 ai 个元素都 ...
- OpenOffice4.1.6 linux安装/卸载教程
以下是centos的安装方法 1.先安装并配置好jdk 2.拷贝 把Apache_OpenOffice_4.1.6_Linux_x86-64_install-rpm_zh-CN.tar.gz拷贝到自己 ...
- PHP反序列化字符逃逸 学习记录
PHP反序列化字符逃逸的原理 当开发者使用先将对象序列化,然后将对象中的字符进行过滤, 最后再进行反序列化.这个时候就有可能会产生PHP反序列化字符逃逸的漏洞. 详解PHP反序列化字符逃逸 过滤后字符 ...
- AB实验:科学归因与增长的利器
第一章 AB实验的基本原理和应用 AB实验的相关概念: 3个基本参数:实验参与单元.实验控制参数.实验指标 2个核心价值:验证因果关系.量化策略效果 2个关键特性:先验性.并行性 基本流程:分流 -& ...
- 一致性hash算法原理及实践
大家好,我是蓝胖子,想起之前学算法的时候,常常只知表面,不得精髓,这个算法到底有哪些应用场景,如何应用在工作中,后来随着工作的深入,一些不懂的问题才慢慢被抽丝剥茧分解出来. 今天我们就来看看工作和面试 ...
- JDBC详解(韩顺平教程)
JDBC 一.原理示意图 二.前提步骤 IDEA导入MySQL的jdbc驱动,并操作数据库 - 打点 - 博客园 (cnblogs.com) 三.JDBC编写步骤: 用法1: package Hsp. ...
- GPT3与机器翻译的结合:探索新的语言翻译技术
目录 引言 随着全球化的加速和人工智能的快速发展,机器翻译成为了许多企业.机构和个人的痛点.虽然已有多种机器翻译技术,但基于自然语言处理和深度学习的机器翻译一直缺乏有效的解决方案,这导致机器翻译的准确 ...
- 代理详解(java代理和CGLIB动态代理)
[代理]大家都知道,特别是在spring中aop.spring中的事务.spring解析注解@Configuration,以及最原始的解析spring.xml的配置,这些都是使用代理来进行实现的, ...
- 搭载ChatGPT之后的表格插件又有哪些新的改变——Function calling增强
摘要:本文由葡萄城技术团队于博客园原创并首发.葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 在<大火的ChatGPT与SpreadJS结合会有哪些意想不到的效果>一文中提 ...