temp数据预处理--以24h为周期的序列

1.按照周期来截取数据

从数据库加载下来的是以5min取一次mean()的列，因此24h应取了24*60/5=288次数据

首先把这8352个数据（最后一个以倒数第二个填充）改成288*30的形式

txt=open('my_data.csv','r')

txt1=open('new_data.csv','w')

temp=[]

for line in txt.readlines():

    line=line.strip('\n')

    temp.append(line)

j=1

n=288

while n:

    s=[]

    for i in range(len(temp)):

        if (i+1)%288 == j:

            s.append(temp[i])

        else:

            pass

    for k in s:

        txt1.write(k)

        txt1.write(',')

    j=j+1

    n=n-1

    if j==288:

        s=[]

        txt1.write('\n')

        for i in range(len(temp)):

            if (i+1)%288 ==0:

                s.append(temp[i])

            else:

                pass

        for k in s:

            txt1.write(k)

            txt1.write(',')

    else:

        pass

    txt1.write('\n')

txt.close()

txt1.close()

2.缺失值和异常处理

https://blog.csdn.net/wangxingfan316/article/details/79363420

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.preprocessing import Imputer

import scipy.fftpack as fftpact

def meaninstead(list):

    #遍历数据进行处理

    con_clou = len(list)

    for i in range(0,cont_clou-1):

        for j in range(0,29):

            if(list[i][j]>1000):

                list[i][j]=(list[i-1][j]+list[i+1][j])

            elif(list[i][j]<=0):

                list[i][j]=(list[i-1][j]+list[i+1][j])

    return list

dataset = pd.read_csv('new_data.csv')

list = np.array(dataset.values.tolist())

list = meaninstead(list)

list.to_csv('clean.csv')

3.降噪

https://www.douban.com/note/698037655/?type=like

傅里叶变换降噪失真度的计算

https://max.book118.com/html/2018/1126/8077042115001134.shtm

5.分箱

import numpy as np

import pandas as pd

dataset = pd.read_csv('june_total.csv')

list1= np.array(dataset.values.tolist())

temp = list1[1,0:]

string =str(pd.qcut(temp,3)[1])

s = string.strip("(").strip("]").split(",")

left = float(s[0])

right=float(s[1])

num=0

count=0

for i in temp:

    if left<i and right>i:

        num+=i

        count+=1

    else:

        continue

print(num/count)

temp数据预处理--以24h为周期的序列的更多相关文章

TensorLayer官方中文文档1.7.4：API – 数据预处理
所属分类:TensorLayer API - 数据预处理¶ 我们提供大量的数据增强及处理方法,使用 Numpy, Scipy, Threading 和 Queue. 不过,我们建议你直接使用 Tens ...
数据准备<3>:数据预处理
数据预处理是指因为算法或者分析需要,对经过数据质量检查后的数据进行转换.衍生.规约等操作的过程.整个数据预处理工作主要包括五个方面内容:简单函数变换.标准化.衍生虚拟变量.离散化.降维.本文将作展开介 ...
scikit-learn与数据预处理
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
python数据预处理for knn
机器学习实战一书中第20页数据预处理,从文本中解析数据的程序. import numpy as np def dataPreProcessing(fileName): with open(fileN ...
借助 SIMD 数据布局模板和数据预处理提高 SIMD 在动画中的使用效率
原文链接简介为发挥 SIMD1 的最大作用,除了对其进行矢量化处理2外,我们还需作出其他努力.可以尝试为循环添加 #pragma omp simd3,查看编译器是否成功进行矢量化,如果性能有所提升 ...
R语言进行数据预处理wranging
R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with R packages:tidyr dplyr Ground rules ...
Scikit-Learn模块学习笔记——数据预处理模块preprocessing
preprocessing 模块提供了数据预处理函数和预处理类,预处理类主要是为了方便添加到 pipeline 过程中. 数据标准化标准化预处理函数: preprocessing.scale(X, ...
Deep Learning 11_深度学习UFLDL教程：数据预处理（斯坦福大学深度学习教程）
理论知识:UFLDL数据预处理和http://www.cnblogs.com/tornadomeet/archive/2013/04/20/3033149.html 数据预处理是深度学习中非常重要的一 ...
R语言--数据预处理
一.日期时间.字符串的处理日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date(), date( ...

随机推荐

最新梦网科技java校招面经（含整理过的面试题大全）
从6月到10月,经过4个月努力和坚持,自己有幸拿到了网易雷火.京东.去哪儿.梦网科技等10家互联网公司的校招Offer,因为某些自身原因最终选择了梦网科技.6.7月主要是做系统复习.项目复盘.Leet ...
RISC-V汇编指南
原文出处:https://github.com/riscv/riscv-asm-manual/blob/master/riscv-asm.md RISC-V Assembly Programmer's ...
转：TSDF in Kinect fusion
KinectFusion中用到的TSDF Fusion 原po:https://blog.csdn.net/qq_31785865/article/details/78524429 最近在看关于稠密三 ...
Spring之23：AbstractBeanFactory，Bean的加载
<spring源码之:循环依赖> AbstractBeanFactory的作用:别名管理,单例创建与注册,工厂方法FactoryBean支持. 由图我们直接的看出,AbstractBean ...
SQL入门经典（第四版）学习记录——欢迎来到SQL世界（一）
1.结构化查询语言——SQL,关系型数据库通信的标准语言: 2.关系型数据库:表的逻辑单元组成,这些表在内部彼此关联,组成了关系型数据库: 3.SQL会话:用户用SQL命令语句与关系型数据库进行交互时 ...
java--demo之猜拳游戏
版本1:人机大战基础随机出用户键盘录入 package com.hainiu.demo; import java.util.Scanner; /* * 人机大战石头剪刀布 */ publi ...
(1+x)^n
#include<stdio.h> int main() { int n,i; while(scanf("%d %d",&n,&i)!=EOF) { i ...
java 用户线程和守护线程
在Java中通常有两种线程:用户线程和守护线程(也被称为服务线程)通过Thread.setDaemon(false)设置为用户线程通过Thread.setDaemon(true)设置为守护线程线程属性 ...
Luogu5363 SDOI2019移动金币（博弈+动态规划）
容易想到可以转化为一个有m堆石子,石子总数不超过n-m的阶梯博弈.阶梯博弈的结论是相当于只考虑奇数层石子的nim游戏. nim和不为0不好算,于是用总方案数减掉nim和为0的方案数.然后考虑dp,按位 ...
Session共享问题---理论
随着网站访问量增加,初期的一台服务器已经完全不能支持业务,这个时候我们就需要增加服务器设备,来抗住请求的增量,如下所示: 负载均衡的目的本来就是要为了平均分配请求,所以没有固定第一次访问和第二次访问的 ...

temp数据预处理--以24h为周期的序列

temp数据预处理--以24h为周期的序列的更多相关文章

随机推荐

热门专题