在数据处理中,经常有高频数据转成低频,秒级数据转成分钟、小时数据等。我们将讨论以下方法:

  1. 使用 Pandas 的 resample 方法:

    • 示例:将天数据转化成月数据。

    • 代码示例:

      import pandas as pd
      import numpy as np # 创建随机成绩score数据
      df = pd.DataFrame({'date': pd.date_range(start='2023-01-01', end='2023-12-31', freq='D'),
      'value': range(365)}) print(df)
      ##########
      date value
      0 2023-01-01 0
      1 2023-01-02 1
      2 2023-01-03 2
      3 2023-01-04 3
      4 2023-01-05 4
      .. ... ...
      360 2023-12-27 360
      361 2023-12-28 361
      362 2023-12-29 362
      363 2023-12-30 363
      364 2023-12-31 364
      [365 rows x 2 columns]
      ########## # 设置索引
      df.set_index('date', inplace=True) # 使用resample()方法进行重新采样
      # 将每日数据转换为每月数据并计算每月的总和
      monthly_data = df['value'].resample('ME').sum() print(monthly_data)
      ##########
      date
      2023-01-31 465
      2023-02-28 1246
      2023-03-31 2294
      2023-04-30 3135
      2023-05-31 4185
      2023-06-30 4965
      2023-07-31 6076
      2023-08-31 7037
      2023-09-30 7725
      2023-10-31 8928
      2023-11-30 9555
      2023-12-31 10819
      Freq: ME, Name: value, dtype: int64
      ########## # 将每日转成每两个月采一次样
      monthly_data2 = df['value'].resample('2ME').sum() print(monthly_data2)
      ##########
      date
      2023-01-31 465
      2023-03-31 3540
      2023-05-31 7320
      2023-07-31 11041
      2023-09-30 14762
      2023-11-30 18483
      2024-01-31 10819
      Freq: 2ME, Name: value, dtype: int64
      ########## # 将每月数据转换为每季度数据并计算每季度的平均值
      quarterly_data = monthly_data.resample('QE').mean() print(quarterly_data)
      ##########
      date
      2023-03-31 1335.000000
      2023-06-30 4095.000000
      2023-09-30 6946.000000
      2023-12-31 9767.333333
      Freq: QE-DEC, Name: value, dtype: float64
      ########## # 将每季度数据转换为每年数据并计算每年的最大值
      annual_data = quarterly_data.resample('YE').max() print(annual_data)
      ##########
      date
      2023-12-31 9767.333333
      Freq: YE-DEC, Name: value, dtype: float64
      ##########
    • 查看每月数据的平均值:df['value'].resample('ME').mean()

      print(df['value'].resample('ME').mean())
      ##########
      date
      2023-01-31 15.0
      2023-02-28 44.5
      2023-03-31 74.0
      2023-04-30 104.5
      2023-05-31 135.0
      2023-06-30 165.5
      2023-07-31 196.0
      2023-08-31 227.0
      2023-09-30 257.5
      2023-10-31 288.0
      2023-11-30 318.5
      2023-12-31 349.0
      Freq: ME, Name: value, dtype: float64
      ##########

Python 数据降级(重采样)的更多相关文章

  1. Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识

    Python 数据分析(二) 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识 第1节 groupby 技术 第2节 数据聚合 第3节 分组级运算和转换 第4 ...

  2. 关于python数据序列化的那些坑

    -----世界上本来没那么多坑,python更新到3以后坑就多了 无论哪一门语言开发,都离不了数据储存与解析,除了跨平台性极好的xml和json之外,python要提到的还有自身最常用pickle模块 ...

  3. Python数据可视化编程实战——导入数据

    1.从csv文件导入数据 原理:with语句打开文件并绑定到对象f.不必担心在操作完资源后去关闭数据文件,with的上下文管理器会帮助处理.然后,csv.reader()方法返回reader对象,通过 ...

  4. Python数据网络采集5--处理Javascript和重定向

    Python数据网络采集5--处理Javascript和重定向 到目前为止,我们和网站服务器通信的唯一方式,就是发出HTTP请求获取页面.有些网页,我们不需要单独请求,就可以和网络服务器交互(收发信息 ...

  5. Python数据可视化——使用Matplotlib创建散点图

    Python数据可视化——使用Matplotlib创建散点图 2017-12-27 作者:淡水化合物 Matplotlib简述: Matplotlib是一个用于创建出高质量图表的桌面绘图包(主要是2D ...

  6. Python数据可视化-seaborn库之countplot

    在Python数据可视化中,seaborn较好的提供了图形的一些可视化功效. seaborn官方文档见链接:http://seaborn.pydata.org/api.html countplot是s ...

  7. Python数据可视化编程实战pdf

    Python数据可视化编程实战(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1vAvKwCry4P4QeofW-RqZ_A 提取码:9pcd 复制这段内容后打开百度 ...

  8. Python数据科学手册

    Python数据科学手册(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1KurSdjNWiwMac3o3iLrzBg 提取码:qogy 复制这段内容后打开百度网盘手 ...

  9. 预测python数据分析师的工资

    前两篇博客分别对拉勾中关于 python 数据分析有关的信息进行获取(https://www.cnblogs.com/lyuzt/p/10636501.html)和对获取的数据进行可视化分析(http ...

  10. Matplotlib 使用 - 《Python 数据科学手册》学习笔记

    一.引入 import matplotlib as mpl import matplotlib.pyplot as plt 二.配置 1.画图接口 Matplotlib 有两种画图接口: (1)一个是 ...

随机推荐

  1. Nacos 多个实例的服务调用失败

    在微服务开发阶段,开发人员会频繁启动服务. 这样Nacos上会经常出现一个服务存在多个实例,这是自己和其他同事都启动了同一个服务造成的. 此时使用OpenFeign对该服务进行远程调用,会有很大概率出 ...

  2. 使用谷歌浏览器打开PDF文件,怎么关闭缩略图

    我们在使用谷歌浏览器浏览PDF文件时,总是会出现章节预览缩略图和工具栏,我们可以使用 参数来控制浏览器不显示出工具栏 #scrollbars=0&toolbar=0&statusbar ...

  3. 重新整理数据结构与算法(c#)—— 线索化二叉树[二十]

    前言 为什么会有线索化二叉树呢? 是这样子的,二叉树呢,比如有n个节点,那么就有n+1个空指针域. 这个是怎么来的呢?比如我们假如一个节点都有左子树和右子树,那么就有2n个节点. 但是我们发现连接我们 ...

  4. Pytorch-tensor的激活函数

    1.激活函数 激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题.因为很多问题都不是线性的,你只有给它加入一些非线性因素,就能够让问题更好的解决. 函数1:RE ...

  5. Koordinator v0.7: 为任务调度领域注入新活力

    简介: 在这个版本中着重建设了机器学习.大数据场景需要的任务调度能力,例如 Coscheduling.ElasticQuota 和精细化的 GPU 共享调度能力.并在调度问题诊断分析方面得到了增强,重 ...

  6. 推荐一个使用 HardLink 硬链接减少重复文件占用磁盘空间的工具

    在 NTFS 文件系统里面,咱可以使用 HardLink 硬链接的方式,将多个重复的文件链接到磁盘的同一份记录里面,从而减少在磁盘里面对重复文件存储多份记录,减少磁盘空间的占用.本文将和大家推荐我所做 ...

  7. dotnet 6 引用 NAudio 的旧版本构建不通过

    本文告诉大家在使用 NAudio 的旧版本导致构建不通过问题,解决方法是升级到 1.10 或以上版本 在更新 dotnet 6 项目时,使用了 NAudio 的旧版本,构建失败,提示 MC1000 如 ...

  8. 2019-9-27-微软的-P2P-下载方式

    title author date CreateTime categories 微软的 P2P 下载方式 lindexi 2019-09-27 09:44:44 +0800 2019-09-27 09 ...

  9. python 打包成exe可执行文件

    一.pyinstall打包 代码编写完成,如何在没有python环境的电脑上运行?编写了一个GUI程序,如何把文件打包好,发给别人直接使用?其实最简单的办法就是把.py源文件,打包成可执行程序员exe ...

  10. 深入理解 C++ 中的多态与文件操作

    C++ 多态 多态(Polymorphism)是面向对象编程(OOP)的核心概念之一,它允许对象在相同操作下表现出不同的行为.在 C++ 中,多态通常通过继承和虚函数来实现. 理解多态 想象一个场景, ...