机器学习14—SVD学习笔记

test14.py

#-*- coding：utf-8

import sys

sys.path.append("svdRec.py")

import svdRec

from numpy import *

from numpy import linalg as la

# U, Sigma, VT = linalg.svd([[1, 1], [7, 7]])

# print(U)

# print(Sigma)

# print(VT)

# Data = svdRec.loadExData()

# U, Sigma, VT = linalg.svd(Data)

# print(Sigma)

#

# Sig3 = mat([[Sigma[0], 0, 0], [0, Sigma[1], 0], [0, 0, Sigma[2]]])

# res = U[:, :3]*Sig3*VT[:3, :]

# print("res:")

# print(res)

#

# myMat = mat(svdRec.loadExData())

# ecl = svdRec.ecludSim(myMat[:, 0], myMat[:, 4])

# print("ecl:")

# print(ecl)

# cos = svdRec.cosSim(myMat[:, 0], myMat[:, 4])

# print("cos:")

# print(cos)

# pears = svdRec.pearsSim(myMat[:, 0], myMat[:, 4])

# print("pears:")

# print(pears)

# myMat = mat(svdRec.loadExData())

# myMat[0, 1] = myMat[0, 0] = myMat[1, 0] = myMat[2, 0] = 4

# myMat[3, 3] = 2

# print("myMat:")

# print(myMat)

#

# tuiJian = svdRec.recommend(myMat, 2)

# print("tuiJian:")

# print(tuiJian)

#

# tuiJian1 = svdRec.recommend(myMat, 2, simMeas = svdRec.ecludSim)

# print("tuiJian1:")

# print(tuiJian1)

#

# tuiJian2 = svdRec.recommend(myMat, 2, simMeas = svdRec.pearsSim)

# print("tuiJian2:")

# print(tuiJian2)

# myMat = mat(svdRec.loadExData2())

# U, Sigma, VT = la.svd(mat(svdRec.loadExData2()))

# print(Sigma)

#

# Sig2 = Sigma**2

# total = sum(Sig2)

# total9 = total*0.9

# print("total9:")

# print(total9)

#

# total3 = sum(Sig2[:3])

# print("total3:")

# print(total3)

# svdRes = svdRec.recommend(myMat, 1, estMethod = svdRec.svdEst)

# print("svdRes:")

# print(svdRes)

originalMat = svdRec.imgCompress(2)

print(originalMat)

print("over!!!")

svdRec.py

'''

Created on Mar 8, 2011

@author: Peter

'''

from numpy import *

from numpy import linalg as la

def loadExData():

    return[[0, 0, 0, 2, 2],

           [0, 0, 0, 3, 3],

           [0, 0, 0, 1, 1],

           [1, 1, 1, 0, 0],

           [2, 2, 2, 0, 0],

           [5, 5, 5, 0, 0],

           [1, 1, 1, 0, 0]]

def loadExData2():

    return[[0, 0, 0, 0, 0, 4, 0, 0, 0, 0, 5],

           [0, 0, 0, 3, 0, 4, 0, 0, 0, 0, 3],

           [0, 0, 0, 0, 4, 0, 0, 1, 0, 4, 0],

           [3, 3, 4, 0, 0, 0, 0, 2, 2, 0, 0],

           [5, 4, 5, 0, 0, 0, 0, 5, 5, 0, 0],

           [0, 0, 0, 0, 5, 0, 1, 0, 0, 5, 0],

           [4, 3, 4, 0, 0, 0, 0, 5, 5, 0, 1],

           [0, 0, 0, 4, 0, 4, 0, 0, 0, 0, 4],

           [0, 0, 0, 2, 0, 2, 5, 0, 0, 1, 2],

           [0, 0, 0, 0, 5, 0, 0, 0, 0, 4, 0],

           [1, 0, 0, 0, 0, 0, 0, 1, 2, 0, 0]]

def ecludSim(inA,inB):

    return 1.0/(1.0 + la.norm(inA - inB))

def pearsSim(inA,inB):

    if len(inA) < 3 : return 1.0

    return 0.5+0.5*corrcoef(inA, inB, rowvar = 0)[0][1]

def cosSim(inA,inB):

    num = float(inA.T*inB)

    denom = la.norm(inA)*la.norm(inB)

    return 0.5+0.5*(num/denom)

def standEst(dataMat, user, simMeas, item):

    n = shape(dataMat)[1]

    simTotal = 0.0; ratSimTotal = 0.0

    for j in range(n):

        userRating = dataMat[user,j]

        if userRating == 0: continue

        # test0 = dataMat[:,item].A>0

        # test1 = dataMat[:,j].A>0

        # test2 = logical_and(dataMat[:,item].A>0, dataMat[:,j].A>0)

        overLap = nonzero(logical_and(dataMat[:,item].A>0, dataMat[:,j].A>0))[0]

        if len(overLap) == 0: similarity = 0

        else: similarity = simMeas(dataMat[overLap,item], dataMat[overLap,j])

        print('the %d and %d similarity is: %f' % (item, j, similarity))

        simTotal += similarity

        ratSimTotal += similarity * userRating

    if simTotal == 0: return 0

    else: return ratSimTotal/simTotal

def svdEst(dataMat, user, simMeas, item):

    n = shape(dataMat)[1]

    simTotal = 0.0; ratSimTotal = 0.0

    U,Sigma,VT = la.svd(dataMat)

    Sig4 = mat(eye(4)*Sigma[:4]) #arrange Sig4 into a diagonal matrix

    xformedItems = dataMat.T * U[:,:4] * Sig4.I  #create transformed items

    for j in range(n):

        userRating = dataMat[user,j]

        if userRating == 0 or j==item: continue

        similarity = simMeas(xformedItems[item,:].T, xformedItems[j,:].T)

        print('the %d and %d similarity is: %f' % (item, j, similarity))

        simTotal += similarity

        ratSimTotal += similarity * userRating

    if simTotal == 0: return 0

    else: return ratSimTotal/simTotal

def recommend(dataMat, user, N=3, simMeas=cosSim, estMethod=standEst):

    unratedTest = nonzero(dataMat[user,:].A==0)

    unratedItems = nonzero(dataMat[user,:].A==0)[1]#find unrated items

    if len(unratedItems) == 0: return 'you rated everything'

    itemScores = []

    for item in unratedItems:

        estimatedScore = estMethod(dataMat, user, simMeas, item)

        itemScores.append((item, estimatedScore))

        # testSort = sorted(itemScores, key=lambda jj: jj[1], reverse=True)[:N]

    return sorted(itemScores, key=lambda jj: jj[1], reverse=True)[:N]

def printMat(inMat, thresh=0.8):

    for i in range(32):

        for k in range(32):

            if float(inMat[i,k]) > thresh:

                print(1),

            else: print(0),

        print('')

def imgCompress(numSV=3, thresh=0.8):

    myl = []

    for line in open('0_5.txt').readlines():

        newRow = []

        for i in range(32):

            newRow.append(int(line[i]))

        myl.append(newRow)

    myMat = mat(myl)

    print("****original matrix******")

    printMat(myMat, thresh)

    U,Sigma,VT = la.svd(myMat)

    SigRecon = mat(zeros((numSV, numSV)))

    for k in range(numSV):#construct diagonal matrix from vector

        SigRecon[k,k] = Sigma[k]

    reconMat = U[:,:numSV]*SigRecon*VT[:numSV,:]

    print("****reconstructed matrix using %d singular values******" % numSV)

    printMat(reconMat, thresh)

机器学习14—SVD学习笔记的更多相关文章

《机器学习实战》学习笔记第十四章 —— 利用SVD简化数据
相关博客: 吴恩达机器学习笔记(八) —— 降维与主成分分析法(PCA) <机器学习实战>学习笔记第十三章 —— 利用PCA来简化数据奇异值分解(SVD)原理与在降维中的应用机器学习( ...
《机器学习实战》学习笔记第九章 —— 决策树之CART算法
相关博文: <机器学习实战>学习笔记第三章 —— 决策树主要内容: 一.CART算法简介二.分类树三.回归树四.构建回归树五.回归树的剪枝六.模型树七.树回归与标准回归的比较 ...
（转载）林轩田机器学习基石课程学习笔记1 — The Learning Problem
(转载)林轩田机器学习基石课程学习笔记1 - The Learning Problem When Can Machine Learn? Why Can Machine Learn? How Can M ...
Coursera台大机器学习基础课程学习笔记1 -- 机器学习定义及PLA算法
最近在跟台大的这个课程,觉得不错,想把学习笔记发出来跟大家分享下,有错误希望大家指正. 一机器学习是什么? 感觉和 Tom M. Mitchell的定义几乎一致, A computer program ...
《SAS编程和数据挖掘商业案例》第14部分学习笔记
继续<SAS编程与数据挖掘商业案例>学习笔记系列,本次重点:经常使用全程语句所谓全程语句.是指能够用在不论什么地方的sas语句,既能够用在data数据步语句里面,也能够用在proc过程步 ...
MNIST机器学习入门【学习笔记】
平台信息:PC:ubuntu18.04.i5.anaconda2.cuda9.0.cudnn7.0.5.tensorflow1.10.GTX1060 作者:庄泽彬(欢迎转载,请注明作者) 说明:本文是 ...
《机器学习实战》学习笔记——第14章利用SVD简化数据
一. SVD 1. 基本概念: (1)定义:提取信息的方法:奇异值分解Singular Value Decomposition(SVD) (2)优点:简化数据, 去除噪声,提高算法的结果 (3)缺点: ...
[转]Python3《机器学习实战》学习笔记（一）：k-近邻算法(史诗级干货长文)
转自http://blog.csdn.net/c406495762/article/details/75172850 版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[-] 一简 ...
林轩田机器学习基石课程学习笔记5 — Training versus Testing
上节课,我们主要介绍了机器学习的可行性.首先,由NFL定理可知,机器学习貌似是不可行的.但是,随后引入了统计学知识,如果样本数据足够大,且hypothesis个数有限,那么机器学习一般就是可行的.本节 ...

随机推荐

kibana-Coordinate Map
1. Visualize 添加图形 2. 选择图形类型 Coordinate Map 3. 选择索引 4. 设定成图的聚合字段如果有数据,点击右上角的三角形,地图上就会有显示. 5. 保存图形
Git从入门到速成
什么是Git Git是Linux发明者Linus开发的一款新时代的版本控制系统,那什么是版本控制系统呢?怎么理解?网上一大堆详细的介绍,但是大多枯燥乏味,对于新手也很难理解,这里我只举几个例子. 熟悉 ...
Requirement Analysis
BRD:Business Requirements Document,商业需求文档.这是产品声明周期中最早的问的文档,再早就应该是脑中的构思了,其内容涉及市场分析,销售策略,盈利预测等,通常是和老大们 ...
hdu1008(c++)
分清上升停留下降一步步来就是了 #include<iostream>#include<vector>using namespace std;int main(){ int N, ...
leetcode题解：Valid Parentheses（栈的应用-括号匹配）
题目: Given a string containing just the characters '(', ')', '{', '}', '[' and ']', determine if the ...
Xml解析(Dom解析xml)
xml四种解析方式: DOM 平台无关的官方解析方式优点:形成了树结构,直观好理解,代码更易编写解析过程中树结构保留在内存中,方便修改缺点:当xml文件较大时,对内存耗费比较大,容易影响解析性能 ...
【PA2012】【BZOJ4289】Tax
Description 给出一个N个点M条边的无向图,经过一个点的代价是进入和离开这个点的两条边的边权的较大值.求从起点1到点N的最小代价. 起点的代价是离开起点的边的边权.终点的代价是进入终点的边的 ...
解决ListView在界面只显示一个item
ListView只显示一条都是scrollview嵌套listView造成的,将listView的高度设置为固定高度之后,三个条目虽然都完全显示.但是这个地方是动态显示的,不能写死.故采用遍历各个子条 ...
SQL 关键字 'USER' 附近有语法错误怎么办
如下图所示,我想要访问我的Database1.mdf的user这张表,提示如下错误 user在SQL Server中是系统保留字,将user修改为[user]就可以了.但是直接在VS中是无法修改的 ...
bat 处理文件路径 (所在目录,文件名,文件后缀名,完整文件名,无后缀路径)
echo off setlocal enabledelayedexpansion set "EXCEL_DIR=%cd%\excel" for /R %EXCEL_DIR% %%f ...

机器学习14—SVD学习笔记

机器学习14—SVD学习笔记的更多相关文章

随机推荐

热门专题