numpy和pandas的基本用法
安装numpy模块
pip install numpy
可以通过导入numpy模块来使用它
import numpy as np
1.创建数组:
a = np.array([1, 2, 3, 4, 5]) # 从列表创建一维数组
b = np.zeros((3, 3)) # 创建一个3x3的全零数组
c = np.ones((2, 2)) # 创建一个2x2的全一数组
d = np.arange(0, 10, 2) # 从0到10(不包括10),步长为2创建一维数组
2.数组操作:
a.shape # 获取数组的形状
a.ndim # 获取数组的维度
a.size # 获取数组的元素个数
a.dtype # 获取数组的数据类型
a.reshape((2, 3)) # 改变数组的形状
a.min() # 返回数组的最小值
a.max() # 返回数组的最大值
a.sum() # 返回数组的元素和
3.数组运算:
a + b # 数组相加(对应元素相加)
a - b # 数组相减(对应元素相减)
a * b # 数组相乘(对应元素相乘)
a / b # 数组相除(对应元素相除)
np.dot(a, b) # 数组的矩阵乘法
np.sin(a) # 对数组中的每个元素应用sin函数
安装pandas模块
pip install pandas
可以通过导入pandas模块来使用它
import pandas as pd
1.创建和读取数据:
# 从CSV文件读取数据
df = pd.read_csv('data.csv')
# 从excel文件读取数据
data = pandas.read_excel('1.xlsx')
2.数据处理和操作:
# 查看数据头部和尾部
df.head() # 默认显示前5行
df.tail(10) # 显示后10行
# 查看数据统计信息
df.describe() # 显示数值列的统计信息
df['column'].mean() # 计算某一列的平均值
# 选择和过滤数据
df['column'] # 选择某一列
df[['column1', 'column2']] # 选择多列
df[condition] # 根据条件选择行
# 添加和删除数据
df['new_column'] = values # 添加新列
df.drop('column', axis=1, inplace=True) # 删除列
# 数据排序和分组
df.sort_values('column') # 按列值排序
df.groupby('column').mean() # 按列分组并计算平均值
# 处理缺失数据
df.dropna() # 删除包含缺失值的行
df.fillna(value) # 用指定值填充缺失值
3.数据可视化:
df.plot() # 绘制折线图
df.plot(kind='bar') # 绘制柱状图
df.plot(kind='scatter', x='column1', y='column2') # 绘制散点图
小案例(读取excel中的数据进行分析)
import numpy as np
import pandas as pd
df = pd.read_excel('1.xlsx', sheet_name='Sheet1')
# 在read_excel()函数中,1.xlsx是Excel文件的路径,Sheet1是要读取的工作表的名称。可以根据需要更改这些参数。
df.head() # 查看数据前几行
df.shape # 查看数据形状(行数和列数)
df.columns # 查看列名
df['column'] # 选择某一列
df.describe() # 查看数据的统计信息
# 使用NumPy的array()函数将数据转换为NumPy数组(如果需要):
data = np.array(df)
numpy和pandas的基本用法的更多相关文章
- numpy和pandas和matplotlib用法
numpy result = [ [0, 10, 20, 30, 40], [10, 23, 33, 43, 53], [20, 83, 23, 55, 33], [30, 93, 44, 22, 5 ...
- 101道Numpy、Pandas练习题
无论是数据分析还是机器学习,数据的预处理必不可少. 其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推 ...
- python安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...
- 如何快速地从mongo中提取数据到numpy以及pandas中去
mongo数据通常过于庞大,很难一下子放进内存里进行分析,如果直接在python里使用字典来存贮每一个文档,使用list来存储数据的话,将很快是内存沾满.型号拥有numpy和pandas import ...
- numpy、pandas
numpy: 仨属性:ndim-维度个数:shape-维度大小:dtype-数据类型. numpy和pandas各def的axis缺省为0,作用于列,除DataFrame的.sort_index()和 ...
- [转] python安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...
- 1.理解Numpy、pandas
之前一直做得只是采集数据,而没有再做后期对数据的处理分析工作,自己也是有意愿去往这些方向学习的,最近就在慢慢的接触. 首先简单理解一下numpy和pandas:一.NumPy:1.NumPy是高性能计 ...
- numpy和pandas简单使用
numpy和pandas简单使用 import numpy as np import pandas as pd 一维数据分析 numpy中使用array, pandas中使用series numpy一 ...
- Python入门之安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了. 首要条件,python版本必 ...
- python及numpy,pandas易混淆的点
https://blog.csdn.net/happyhorizion/article/details/77894035 初接触python觉得及其友好(类似matlab),尤其是一些令人拍案叫绝不可 ...
随机推荐
- 从GFS到GPT,AI Infra的激荡20年
导读 最近AIGC和LLM的浪潮层层迭起,大有把AI行业过去十年画的饼,一夜之间完全变现的势头.而 AI Infra (构建AI所需的基础设施),也成了讨论的焦点之一.大众对AI Infra的关注点 ...
- Actor Prioritized Experience Replay
论文宗旨: 由于PER 是以TD-error成正比的非均匀概率进行抽样的,但是在AC算法中即连续动作空间中,会表现出低效果. 分析结果是:Actor不能有效的从high TD-error的transi ...
- go语言中实现生产者-消费者模式有哪些方法呢
1. 简介 本文将介绍在 Go 语言中实现生产者消费者模式的多种方法,并重点探讨了通道.条件变量的适用场景和优缺点.我们将深入讨论这些方法的特点,以帮助开发者根据应用程序需求选择最适合的方式.通过灵活 ...
- < Python全景系列-7 > 提升Python编程效率:模块与包全面解读
欢迎来到我们的系列博客<Python全景系列>!在这个系列中,我们将带领你从Python的基础知识开始,一步步深入到高级话题,帮助你掌握这门强大而灵活的编程语法.无论你是编程新手,还是有一 ...
- Java 网络编程 —— 创建非阻塞的 HTTP 服务器
HTTP 概述 HTTP 客户程序必须先发出一个 HTTP 请求,然后才能接收到来自 HTTP 服器的响应,浏览器就是最常见的 HTTP 客户程序.HTTP 客户程序和 HTTP 服务器分别由不同的软 ...
- MassTransit实现Saga模式概览
原文地址:Saga Overview 编排一系列事件的能力是一个强大的功能,而MassTransit使这成为可能. saga是由协调器管理的长期事务.saga是由事件发起的,saga编排事件,saga ...
- 深入理解注解驱动配置与XML配置的融合与区别
摘要:本文旨在深入探讨Spring框架的注解驱动配置与XML配置,揭示两者之间的相似性与差异. 本文分享自华为云社区<Spring高手之路2--深入理解注解驱动配置与XML配置的融合与区别> ...
- Python异步编程之web框架 异步vs同步 数据库IO任务压测对比
测试基本信息 主题:比较异步框架和同步框架在数据库IO操作的性能差异 python版本:python 3.8 数据库:mysql 8.0.27 (docker部署) 压测工具:locust web框架 ...
- Volo.Abp升级小记(二)创建全新微服务模块
@ 目录 创建模块 领域层 应用层 数据库和仓储 控制器 配置微服务 测试微服务 微服务注册 添加资源配置 配置网关 运行项目 假设有一个按照官方sample搭建的微服务项目,并安装好了abp-cli ...
- CF1810H Last Number
大难题,但是非常的有意思.思路来自 \(\color{black}\text{艾}\color{red}\text{利克斯·伟}\).补充了一点小细节. 题意 对于一个 可重 集合 \(S\),初始为 ...