安装numpy模块

pip install numpy

可以通过导入numpy模块来使用它

import numpy as np

1.创建数组:

a = np.array([1, 2, 3, 4, 5])  # 从列表创建一维数组
b = np.zeros((3, 3)) # 创建一个3x3的全零数组
c = np.ones((2, 2)) # 创建一个2x2的全一数组
d = np.arange(0, 10, 2) # 从0到10(不包括10),步长为2创建一维数组

2.数组操作:

a.shape  # 获取数组的形状
a.ndim # 获取数组的维度
a.size # 获取数组的元素个数
a.dtype # 获取数组的数据类型
a.reshape((2, 3)) # 改变数组的形状
a.min() # 返回数组的最小值
a.max() # 返回数组的最大值
a.sum() # 返回数组的元素和

3.数组运算:

a + b  # 数组相加(对应元素相加)
a - b # 数组相减(对应元素相减)
a * b # 数组相乘(对应元素相乘)
a / b # 数组相除(对应元素相除)
np.dot(a, b) # 数组的矩阵乘法
np.sin(a) # 对数组中的每个元素应用sin函数

安装pandas模块

pip install pandas

可以通过导入pandas模块来使用它

import pandas as pd

1.创建和读取数据:

# 从CSV文件读取数据
df = pd.read_csv('data.csv')
# 从excel文件读取数据
data = pandas.read_excel('1.xlsx')

2.数据处理和操作:

# 查看数据头部和尾部
df.head() # 默认显示前5行
df.tail(10) # 显示后10行 # 查看数据统计信息
df.describe() # 显示数值列的统计信息
df['column'].mean() # 计算某一列的平均值 # 选择和过滤数据
df['column'] # 选择某一列
df[['column1', 'column2']] # 选择多列
df[condition] # 根据条件选择行 # 添加和删除数据
df['new_column'] = values # 添加新列
df.drop('column', axis=1, inplace=True) # 删除列 # 数据排序和分组
df.sort_values('column') # 按列值排序
df.groupby('column').mean() # 按列分组并计算平均值 # 处理缺失数据
df.dropna() # 删除包含缺失值的行
df.fillna(value) # 用指定值填充缺失值

3.数据可视化:

df.plot()  # 绘制折线图
df.plot(kind='bar') # 绘制柱状图
df.plot(kind='scatter', x='column1', y='column2') # 绘制散点图

小案例(读取excel中的数据进行分析)

import numpy as np
import pandas as pd df = pd.read_excel('1.xlsx', sheet_name='Sheet1')
# 在read_excel()函数中,1.xlsx是Excel文件的路径,Sheet1是要读取的工作表的名称。可以根据需要更改这些参数。 df.head() # 查看数据前几行
df.shape # 查看数据形状(行数和列数)
df.columns # 查看列名
df['column'] # 选择某一列
df.describe() # 查看数据的统计信息 # 使用NumPy的array()函数将数据转换为NumPy数组(如果需要):
data = np.array(df)

numpy和pandas的基本用法的更多相关文章

  1. numpy和pandas和matplotlib用法

    numpy result = [ [0, 10, 20, 30, 40], [10, 23, 33, 43, 53], [20, 83, 23, 55, 33], [30, 93, 44, 22, 5 ...

  2. 101道Numpy、Pandas练习题

    无论是数据分析还是机器学习,数据的预处理必不可少. 其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推 ...

  3. python安装numpy和pandas

    最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...

  4. 如何快速地从mongo中提取数据到numpy以及pandas中去

    mongo数据通常过于庞大,很难一下子放进内存里进行分析,如果直接在python里使用字典来存贮每一个文档,使用list来存储数据的话,将很快是内存沾满.型号拥有numpy和pandas import ...

  5. numpy、pandas

    numpy: 仨属性:ndim-维度个数:shape-维度大小:dtype-数据类型. numpy和pandas各def的axis缺省为0,作用于列,除DataFrame的.sort_index()和 ...

  6. [转] python安装numpy和pandas

    最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...

  7. 1.理解Numpy、pandas

    之前一直做得只是采集数据,而没有再做后期对数据的处理分析工作,自己也是有意愿去往这些方向学习的,最近就在慢慢的接触. 首先简单理解一下numpy和pandas:一.NumPy:1.NumPy是高性能计 ...

  8. numpy和pandas简单使用

    numpy和pandas简单使用 import numpy as np import pandas as pd 一维数据分析 numpy中使用array, pandas中使用series numpy一 ...

  9. Python入门之安装numpy和pandas

    最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了. 首要条件,python版本必 ...

  10. python及numpy,pandas易混淆的点

    https://blog.csdn.net/happyhorizion/article/details/77894035 初接触python觉得及其友好(类似matlab),尤其是一些令人拍案叫绝不可 ...

随机推荐

  1. Django的ModelAdmin自带

    需要自定义数据表中哪些字段可以显示,哪些字段可以编辑,并对数据表中的条目进行排序,同时定义过滤选项.Django的ModelAdmin自带的list_display, list_filter, lis ...

  2. Nacos必知必会:这些知识点你一定要掌握!

    前言 Nacos 是一个开源的服务发现.配置管理和服务治理平台,是阿里巴巴开源的一款产品. Nacos 可以帮助开发者更好地管理微服务架构中的服务注册.配置和发现等问题,提高系统的可靠性和可维护性. ...

  3. vue数组更改页面无法刷新

    今一个图片列表的数组,在新增数据时页面会同步相应,但是进行删除操作时老是无法实现页面及时刷新,使用过vue set也没见效果,纠结半天,哎原来是嵌套对象的坑 一.图片上传时 页面加的图片列表的html ...

  4. 万字长文详述ClickHouse在京喜达实时数据的探索与实践

    1 前言 京喜达技术部在社区团购场景下采用JDQ+Flink+Elasticsearch架构来打造实时数据报表.随着业务的发展 Elasticsearch开始暴露出一些弊端,不适合大批量的数据查询,高 ...

  5. uniapp主题切换功能的第一种实现方式(scss变量+vuex)

    随着用户端体验的不断提升,很多应用在上线的时候都要求做不同的主题,最基本的就是白天与夜间主题. 就像b站app主题切换,像这样的 uniapp因为能轻松实现多端发布而得到很多开发者的青睐,但每个端的实 ...

  6. 效率神器,边看网页边问ChatGPT!神级ChatGPT插件(浏览器扩展)推荐!

    如果在看一个网页时,有些词不认识.句子不知道含义,怎么办? 憨憨版:不认识就算了呗,还能咋滴 进阶版:复制到 Google/Baidu 里问一问: AI达人版:复制到 ChatGPT/Claude 里 ...

  7. 02. vmware搭建centos虚拟机并使用静态ip,局域网内可互通

    一.虚拟机镜像地址 我这里有镜像 二.目的 使用vmware搭建centos虚拟机集群,进行基础服务搭建,对系统业务提供服务支撑 三.效果 centos虚拟机ip不会自动改变,使用设置的静态ip,可以 ...

  8. OSI七层协议剩余、socket模块、半连接池

    传输层之TCP与UDP协议 TCP与UDP都是用来规定通信方式的 通信的时候可以随心所欲的聊 也可以遵循一些协议符合要求的聊 随心所欲的聊:文字 图片 视频 遵循一些协议:开头带尊称 首行空两个 只准 ...

  9. 前端vue仿京东天猫简单好用的瀑布流瀑布流式布局列表组件waterfall

    前端vue仿京东天猫简单好用的瀑布流瀑布流式布局列表组件waterfall, 下载完整代码请访问uni-app插件市场址:https://ext.dcloud.net.cn/plugin?id=130 ...

  10. 6大数据实战系列-sparkSql实战

    sparkSql两个最重要的类SqlContext.DataFrame,DataFrame功能强大,能够与rdd互转换.支持sql操作如sql().where.order.join.groupBy.l ...