1.背景

项目须要，打算用python实现矩阵的去噪和归一化。用numpy这些数学库没有找到非常理想的函数。所以一怒之下自己用标准库写了一个去噪和归一化的算法，效率有点低，只是还能用，大家假设有须要能够拿去。

（1）去噪算法：依据概率论的知识，假设一组数据服从正态分布，我们设均值是n，方差是v，那么对于每一个离散数值有百分之九十二以上的概率会在（n-3*v,n+3*v）的区间内。

所以这里的去噪功能主要是实现假设超出了区间就将这个值标记为区间所能容忍最大值。

（2）归一化：找到输入队列最大值max。最小值min。对随意一个自变量x。它的归一化数值为(x-min/max-min)。

2.实现代码

from __future__ import division

def GetAverage(mat):

    n=len(mat)

    m= width(mat)

    num = [0]*m

    for j in range(0,m):

           for i in mat:

              num[j]=num[j]+i[j]

           num[j]=num[j]/n

    return num

def width(lst):

    i=0

    for j in lst[0]:

       i=i+1

    return i

def GetVar(average,mat):

    ListMat=[]

    for i in mat:

        ListMat.append(list(map(lambda x: x[0]-x[1], zip(average, i))))

    n=len(ListMat)

    m= width(ListMat)

    num = [0]*m

    for j in range(0,m):

        for i in ListMat:

                  num[j]=num[j]+(i[j]*i[j])

        num[j]=num[j]/n

    return num 

def DenoisMat(mat):

    average=GetAverage(mat)

    variance=GetVar(average,mat)

    section=list(map(lambda x: x[0]+x[1], zip(average, variance)))    

    n=len(mat)

    m= width(mat)

    num = [0]*m

    denoisMat=[]

    for i in mat:

        for j in range(0,m):

               if i[j]>section[j]:

                     i[j]=section[j]

        denoisMat.append(i)

    return denoisMat                

def AutoNorm(mat):

    n=len(mat)

    m= width(mat)

    MinNum=[9999999999]*m

    MaxNum = [0]*m

    for i in mat:

        for j in range(0,m):

            if i[j]>MaxNum[j]:

                MaxNum[j]=i[j]

    for p in mat:

        for q in range(0,m):

            if p[q]<=MinNum[q]:

                    MinNum[q]=p[q]  

    section=list(map(lambda x: x[0]-x[1], zip(MaxNum, MinNum)))

    print section

    NormMat=[]

    for k in mat:     

          distance=list(map(lambda x: x[0]-x[1], zip(k, MinNum)))

          value=list(map(lambda x: x[0]/x[1], zip(distance,section)))

          NormMat.append(value)

    return NormMat

库的实现：输入矩阵mat，

GetAverage(mat)：返回均值

GetVar(average,mat)：返回方差

DenoisMat(mat)：去噪

AutoNorm(mat)：归一化矩阵

下载地址：点击下载

/********************************

* 本文来自博客 “李博Garvin“

* 转载请标明出处:http://blog.csdn.net/buptgshengod

******************************************/

【机器学习算法-python实现】矩阵去噪以及归一化的更多相关文章

【机器学习算法-python实现】KNN-k近邻算法的实现（附源代码）
,400],[200,5],[100,77],[40,300]]) shape:显示(行,列)例:shape(group)=(4,2) zeros:列出一个同样格式的空矩阵,例:zeros(group ...
机器学习算法 Python&R 速查表
sklearn实战-乳腺癌细胞数据挖掘( 博主亲自录制) https://study.163.com/course/introduction.htm?courseId=1005269003&u ...
【机器学习算法-python实现】决策树-Decision tree（1）信息熵划分数据集
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景决策书算法是一种逼近离散数值的分类算法,思路比較简单,并且准确率较高.国际权威的学术组织,数据挖掘国际 ...
【机器学习算法-python实现】Adaboost的实现(1)-单层决策树(decision stump)
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景上一节学习支持向量机,感觉公式都太难理解了,弄得我有点头大.只是这一章的Adaboost线比 ...
【机器学习算法-python实现】採样算法的简单实现
1.背景採样算法是机器学习中比較经常使用,也比較easy实现的(出去分层採样).经常使用的採样算法有下面几种(来自百度知道): 一.单纯随机抽样(simple random samp ...
【机器学习算法-python实现】PCA 主成分分析、降维
1.背景 PCA(Principal Component Analysis),PAC的作用主要是减少数据集的维度,然后挑选出基本的特征. PCA的主要思想是移动坐标轴, ...
【机器学习算法-python实现】协同过滤（cf）的三种方法实现
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景协同过滤(collaborative filtering)是推荐系统经常使用的一种方法.c ...
市场清仓价格算法 python求矩阵不同行不同列元素和的最大值
问题描述求矩阵不同行不同列元素和的最大值(最小值) 问题求解 1.通过scipy库求解 scipy.optimize库中的linear_sum_assignment方法可以求解输入一个矩阵,参数m ...
【机器学习算法-python实现】svm支持向量机(1)—理论知识介绍
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景强烈推荐阅读(http://www.cnblogs.com/jerrylead/archiv ...

随机推荐

镜像文件挂载及本地yum搭建
环境:centos7.2 背景:企业内网不能上网,需安装软件以及软件之间的依赖问题解决方案:下载和企业内网服务器相同版本的centos7.2镜像文件完整版(不是最小化的iso) 挂载镜像文件 1.上 ...
【AtCoder】ARC103
C - //// 为了防止一些多余的判断,我选择直接记录每个数的个数,然后枚举第一个数,找第一个数之外第二个数改变最少的情况下应该选什么代码 #include <bits/stdc++.h&g ...
P1855 榨取kkksc03 二维费用背包
Kkksc03的时间和金钱是有限的,所以他很难满足所有同学的愿望.所以他想知道在自己的能力范围内,最多可以完成多少同学的愿望? 输入输出格式输入格式: 第一行,n M T,表示一共有n(n<= ...
利用 gdb 探究main(int argc, char *argv[]){} 中的char *argv[]
在 Linux 系统中编写小程序代码如下编译并采用gdb调试在调试之前设置三个参数 a bb ccc 输入 start 执行代码到 return 0; 从这里可以看到 argc = ...
洛谷P2017 [USACO09DEC]晕牛Dizzy Cows [拓扑排序]
题目传送门晕牛Dizzy Cows 题目背景 Hzwer 神犇最近又征服了一个国家,然后接下来却也遇见了一个难题. 题目描述 The cows have taken to racing each o ...
P3402 最长公共子序列
P3402 最长公共子序列经典问题LCS-->LIS把第一数列转化成1~n,然后将第二个数列映射成1~n中的一些数,然后求第二个数列的LIS即可,然后用Bit求LIS,O(nlogN) //数据 ...
002.Git日常基础使用
一获取git仓库 1.1 初始化仓库 [root@git ~]# cd /mystudy/ [root@git mystudy]# git init [root@git mystudy]# git ...
【GO基础】main redeclared in this block问题的排查与解决
之前的GO练习环境放在虚拟机内,方便了不少.不过在liteIDE打开的情况下,我迁移了虚拟机,刚好两台机子的VMware版本还不同,这就导致了无法恢复挂起状态,我放弃了挂起. 重新启动后,为了继续练习 ...
Codeforces.786B.Legacy(线段树优化建图最短路Dijkstra)
题目链接 \(Description\) 有\(n\)个点.你有\(Q\)种项目可以选择(边都是有向边,每次给定\(t,u,v/lr,w\)): t==1,建一条\(u\to v\)的边,花费\(w\ ...
BZOJ.4516.[SDOI2016]生成魔咒(后缀自动机 map)
题目链接后缀数组做法见这. 直接SAM+map.对于每个节点其产生的不同子串数为len[i]-len[fa[i]]. //15932kb 676ms #include <map> #in ...

【机器学习算法-python实现】矩阵去噪以及归一化

1.背景

2.实现代码

【机器学习算法-python实现】矩阵去噪以及归一化的更多相关文章

随机推荐

热门专题