推荐算法 pd

from numpy import *

from numpy import linalg as la

def loadExData1():

    return [[2,0,0,4,4,0,0,0,0,0,0],

            [0,0,0,0,0,0,0,0,0,0,5],

            [0,0,0,0,0,0,0,1,0,4,0],

            [3,3,4,0,3,0,0,2,2,0,0],

            [5,5,5,0,0,0,0,0,0,0,0],

            [0,0,0,0,0,0,5,0,0,5,0],

            [4,0,4,0,0,0,0,0,0,0,5],

            [0,0,0,0,0,4,0,0,0,0,4],

            [0,0,0,0,0,0,5,0,0,5,0],

            [0,0,0,3,0,0,0,0,4,5,0],

            [1,1,2,1,1,2,1,0,4,5,0]]

#相似度计算

def ecludSim(inA,inB):

    return 1.0/(1.0 + la.norm(inA - inB))

def pearsSim(inA,inB):

    if len(inA) < 3 : return 1.0

    return 0.5+0.5*corrcoef(inA, inB, rowvar=0)[0][1]

def cosSim(inA, inB):

    """

    :param inA: [a]

    :param inB: [b]

    :return: 1 or 0

    """

    num = float(inA.T*inB)

    demon = la.norm(inA)*la.norm(inB)

    return 0.5+0.5*(num/demon)  # 0.5+0.5*(a*b/abs(a*b))

#  基于物品相似度的推荐引擎

def standEst(dataMat, user, simMeas, item):

    """

    :param dataMat: ex loadExdata1()

    :param user: ex user=1

    :param simMeas: cosSim()

    :param item: ex  # user=1对应的数据[0,0,0,0,0,0,0,0,0,0,5]的列=0的下标为 0 1 2 3 4 5 6 7 8 9

    :return: 相似度

    """

    n = shape(dataMat)[1]

    simTotal = 0.0; ratSimTotal = 0.0

    for j in range(n):  # shape(dataMat):[x, n] x:数据集长度  n:维度

        userRating = dataMat[user, j]  # 取出user这条数据 a = np.array[[1,2,3],[0,2,1]]

        if userRating == 0:                  #   for i in [0,1,2]: print(a[1, i])  # 0 2 1

            continue

        # logical_and----  numpy逻辑与的判断

        # logical_or----  numpy逻辑或的判断

        # logical_not----  numpy逻辑非的判断

        overLap = nonzero(logical_and(dataMat[:, item].A > 0, \

                                     dataMat[:, j].A > 0))[0]

        if len(overLap) == 0:

            similarity = 0

        else:

            similarity = simMeas(dataMat[overLap,item],\

                                 dataMat[overLap,j])

        print('the %d and %d similarity is: %f'%(item, j, similarity))

        simTotal += similarity

        ratSimTotal += similarity * userRating

    if simTotal == 0:

        return 0

    return ratSimTotal/simTotal

# 将一个11纬的矩阵转换成一个5维的矩阵,基于SVD的评3分估计

def svdEst(dataMat, user, simMeas, item):

    n = shape(dataMat)[1]      #获取物品的数量

    simTotal = 0.0; ratSimTotal = 0.0

    U,Sigma, VT = la.svd(dataMat)

    Sig4 = mat(eye(4)*Sigma[:4])

    xformedItems = dataMat.T*U[:,:4]*Sig4.I

    for j in range(n):

        userRating = dataMat[user,j]

        if userRating == 0 or j==item: continue

        similarity = simMeas(xformedItems[item,:].T,\

                            xformedItems[j,:].T)

        print('the %d and %d similarity is:%f'%(item, j, similarity))

        simTotal += similarity

        ratSimTotal += similarity * userRating

    if simTotal == 0:return 0

    else: return ratSimTotal/simTotal

def recommend(dataMat, user, N=3, simMeas=cosSim, estMethod=standEst):

    """

    :param dataMat: 测试数据集， ex loadExData1()

    :param user: 用户ID所对应的行号index， ex user=1

    :param N: default N=3 N个推荐结果，默认设为3

    :param simMeas: 默认相关性函数cosSim

    :param estMethod: 默认基于物品相似度的推荐函数standEst

    :return: N个推荐结果

    """

    unratedItems = nonzero(dataMat[user,:].A==0)[1]   #返回user=1行[0,0,0,0,0,0,0,0,0,0,5],中元素为0的列下标

    if len(unratedItems) == 0:

        return 'you rated everything'

    itemScores = []

    for item in unratedItems:  # [0 1 2 3 4 5 6 7 8 9]

        estimatedScore = estMethod(dataMat, user, simMeas, item)

        itemScores.append((item, estimatedScore))

    return sorted(itemScores, key=lambda jj: jj[1], reverse=True)[:N]

if __name__ == '__main__':

    data = mat(loadExData1())

    re = recommend(data, 1)

    print(re)

from django.db import connection

  select_sql = 'select * from model'

    datas = pd.read_sql(select_sql, connection)  # <pandas.core.frame.DataFrame'>

    temp = datas.iloc[:, 2:]  # 取出所有数据的 除了前两个字段

    tp = temp.sum(axis=0)  # 所有字段纵向相加

    top_sorts = tp.sort_values(ascending=False)  # 降序排序

    top3 = top_sorts.index[:4]

    top_recommends = top3.values.tolist()

随机推荐

pyhanlp 停用词与用户自定义词典功能详解
hanlp的词典模式之前我们看了hanlp的词性标注,现在我们就要使用自定义词典与停用词功能了,首先关于HanLP的词性标注方式具体请看HanLP词性标注集. 其核心词典形式如下: 自定义词典自定 ...
gcc系强制链接静态库（同时有.so和.a）
1. 坑多的办法 -static 如果需要链接成不依赖任何so文件的程序,用ldd查看显示为"not a dynamic executable",但是这个选项时不推荐的. 即使像这 ...
导入导出Excel文件
搭建环境先新建web project ,然后Add Struts Capabilties: 下载导入导出Excel所需的jar包: poi-3.8-20120326.jar包 : http:// ...
网易云课堂js学习笔记
javascript:用来在页面中编写特效的,和html/css一样都是由浏览器解析的 javascript语言: 一.js如何运行的(javaScript,jscript,vbscript,appl ...
基于tensorflow的MNIST手写识别
这个例子,是学习tensorflow的人员通常会用到的,也是基本的学习曲线中的一环.我也是! 这个例子很简单,这里,就是简单的说下,不同的tensorflow版本,相关的接口函数,可能会有不一样哟.在 ...
Using the SDRAM on Altera’s DE1-SoC Board with Verilog Designs
Using the SDRAM on Altera’sDE1-SoC Board with Verilog Designs 1.DE1-SOC Board上SDRAM资源 2.系统架构框图 3.关于S ...
抓包及分析（wireshark&tcpdump）
1.简介 Wireshark是一个网络协议检测工具,支持Windows平台和Unix平台,我一般只在Windows平台下使用Wireshark,如果是Linux的话,我直接用tcpdump了,因为我工 ...
安装老版本redis .NET 客户端
https://github.com/ServiceStackV3/ServiceStackV3 PM> Install-Package ServiceStack -Version 3.9.71 ...
@@identity与scope_identity()函数的区别
@@IDENTITY 和SCOPE_IDENTITY 返回在当前会话中的任何表内所生成的最后一个标识值. SCOPE_IDENTITY 只返回插入到当前作用域中的值: @@IDENTITY 不受限于特 ...
Java第02次实验提纲(Java基本语法与类库)
1. 熟悉Git 1.1 学会使用网页版的操作代码仓库(gitee) 申请账号,然后根据老师提供的链接或者二维码加入团队,然后修改昵称. fork老师提供的代码库项目,新建自己学号命名的文件并上传一些 ...

推荐算法 pd

推荐算法 pd的更多相关文章

随机推荐

热门专题