temp数据预处理--以24h为周期的序列
1.按照周期来截取数据
从数据库加载下来的是以5min取一次mean()的列,因此24h应取了24*60/5=288次数据
首先把这8352个数据(最后一个以倒数第二个填充)改成288*30的形式
txt=open('my_data.csv','r')
txt1=open('new_data.csv','w')
temp=[]
for line in txt.readlines():
line=line.strip('\n')
temp.append(line)
j=1
n=288
while n:
s=[]
for i in range(len(temp)):
if (i+1)%288 == j:
s.append(temp[i])
else:
pass
for k in s:
txt1.write(k)
txt1.write(',')
j=j+1
n=n-1
if j==288:
s=[]
txt1.write('\n')
for i in range(len(temp)):
if (i+1)%288 ==0:
s.append(temp[i])
else:
pass
for k in s:
txt1.write(k)
txt1.write(',')
else:
pass
txt1.write('\n')
txt.close()
txt1.close()
2.缺失值和异常处理
https://blog.csdn.net/wangxingfan316/article/details/79363420
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.preprocessing import Imputer
import scipy.fftpack as fftpact def meaninstead(list):
#遍历数据进行处理
con_clou = len(list)
for i in range(0,cont_clou-1):
for j in range(0,29):
if(list[i][j]>1000):
list[i][j]=(list[i-1][j]+list[i+1][j])
elif(list[i][j]<=0):
list[i][j]=(list[i-1][j]+list[i+1][j])
return list dataset = pd.read_csv('new_data.csv')
list = np.array(dataset.values.tolist())
list = meaninstead(list)
list.to_csv('clean.csv')
3.降噪
https://www.douban.com/note/698037655/?type=like
傅里叶变换降噪失真度的计算
https://max.book118.com/html/2018/1126/8077042115001134.shtm
5.分箱
import numpy as np
import pandas as pd
dataset = pd.read_csv('june_total.csv')
list1= np.array(dataset.values.tolist())
temp = list1[1,0:]
string =str(pd.qcut(temp,3)[1])
s = string.strip("(").strip("]").split(",")
left = float(s[0])
right=float(s[1]) num=0
count=0
for i in temp:
if left<i and right>i:
num+=i
count+=1
else:
continue
print(num/count)
temp数据预处理--以24h为周期的序列的更多相关文章
- TensorLayer官方中文文档1.7.4:API – 数据预处理
所属分类:TensorLayer API - 数据预处理¶ 我们提供大量的数据增强及处理方法,使用 Numpy, Scipy, Threading 和 Queue. 不过,我们建议你直接使用 Tens ...
- 数据准备<3>:数据预处理
数据预处理是指因为算法或者分析需要,对经过数据质量检查后的数据进行转换.衍生.规约等操作的过程.整个数据预处理工作主要包括五个方面内容:简单函数变换.标准化.衍生虚拟变量.离散化.降维.本文将作展开介 ...
- scikit-learn与数据预处理
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
- python数据预处理for knn
机器学习实战 一书中第20页数据预处理,从文本中解析数据的程序. import numpy as np def dataPreProcessing(fileName): with open(fileN ...
- 借助 SIMD 数据布局模板和数据预处理提高 SIMD 在动画中的使用效率
原文链接 简介 为发挥 SIMD1 的最大作用,除了对其进行矢量化处理2外,我们还需作出其他努力.可以尝试为循环添加 #pragma omp simd3,查看编译器是否成功进行矢量化,如果性能有所提升 ...
- R语言进行数据预处理wranging
R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with R packages:tidyr dplyr Ground rules ...
- Scikit-Learn模块学习笔记——数据预处理模块preprocessing
preprocessing 模块提供了数据预处理函数和预处理类,预处理类主要是为了方便添加到 pipeline 过程中. 数据标准化 标准化预处理函数: preprocessing.scale(X, ...
- Deep Learning 11_深度学习UFLDL教程:数据预处理(斯坦福大学深度学习教程)
理论知识:UFLDL数据预处理和http://www.cnblogs.com/tornadomeet/archive/2013/04/20/3033149.html 数据预处理是深度学习中非常重要的一 ...
- R语言--数据预处理
一.日期时间.字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date(), date( ...
随机推荐
- 优化apk的odex处理
前文讲到了apk的反编译流程,但在有的情况下会出现apk的资源文件和代码文件分开的情况,这种情况会出现如下目录结构,并且在apk文件里面并没有dex文件. 所需工具 smali.jar和baksmal ...
- hdu 1106
排序 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submissi ...
- rest_framework之ModelViewSet、路由控制、序列化组件快速搭建项目雏形
以UserInfo表登陆接口为例 ModelViewSet的用法十分简单,定义一个视图类,指定一个模型表,指定一个序列化类即可帮我们完成增删改查等功能 示例: # 视图层 from app01.MyS ...
- MySQL安装时出现的问题
mysql正常安装结束之后需要连接你所安装的数据库的时候出现下面的错误: Client does not support authentication protocol requested by se ...
- 【Linux内核】编译与配置内核(x86)
[Linux内核]编译与配置内核(x86) https://www.cnblogs.com/jamesharden/p/6414736.html
- Openssl 加解密文件
使用openssl 的命令行进行文件的加密与解密过程,主要有两种方式: openssl 指定加密/解密算法加密 openssl 指定公钥/私钥文件加密 openssl 指定加密/解密算法加密 To E ...
- [转帖]阿里云VS腾讯云 谁才是中国未来的云计算之王?
阿里云VS腾讯云 谁才是中国未来的云计算之王? https://www.qianzhan.com/analyst/detail/220/191008-f05009f6.html 吴小燕• 2019-1 ...
- C#传递参数调用exe程序
今天公司让我把Winform程序里的一块单独成一个exe文件,从原程序中打开新的exe程序,这就涉及到参数的传递,故来记录下传递参数到exe程序的方式 第一种方式 首先在程序A中添加引用using S ...
- Zuma CodeForces - 607B (区间DP)
大意: 给定字符串, 每次删除一个回文子串, 求最少多少次删完. #include <iostream> #include <cstdio> #define REP(i,a,n ...
- Autofac三种生命周期
InstancePerLifetimeScope:同一个Lifetime生成的对象是同一个实例 SingleInstance:单例模式,每次调用,都会使用同一个实例化的对象:每次都用同一个对象: In ...