推荐算法 pd

from numpy import *

from numpy import linalg as la

def loadExData1():

    return [[2,0,0,4,4,0,0,0,0,0,0],

            [0,0,0,0,0,0,0,0,0,0,5],

            [0,0,0,0,0,0,0,1,0,4,0],

            [3,3,4,0,3,0,0,2,2,0,0],

            [5,5,5,0,0,0,0,0,0,0,0],

            [0,0,0,0,0,0,5,0,0,5,0],

            [4,0,4,0,0,0,0,0,0,0,5],

            [0,0,0,0,0,4,0,0,0,0,4],

            [0,0,0,0,0,0,5,0,0,5,0],

            [0,0,0,3,0,0,0,0,4,5,0],

            [1,1,2,1,1,2,1,0,4,5,0]]

#相似度计算

def ecludSim(inA,inB):

    return 1.0/(1.0 + la.norm(inA - inB))

def pearsSim(inA,inB):

    if len(inA) < 3 : return 1.0

    return 0.5+0.5*corrcoef(inA, inB, rowvar=0)[0][1]

def cosSim(inA, inB):

    """

    :param inA: [a]

    :param inB: [b]

    :return: 1 or 0

    """

    num = float(inA.T*inB)

    demon = la.norm(inA)*la.norm(inB)

    return 0.5+0.5*(num/demon)  # 0.5+0.5*(a*b/abs(a*b))

#  基于物品相似度的推荐引擎

def standEst(dataMat, user, simMeas, item):

    """

    :param dataMat: ex loadExdata1()

    :param user: ex user=1

    :param simMeas: cosSim()

    :param item: ex  # user=1对应的数据[0,0,0,0,0,0,0,0,0,0,5]的列=0的下标为 0 1 2 3 4 5 6 7 8 9

    :return: 相似度

    """

    n = shape(dataMat)[1]

    simTotal = 0.0; ratSimTotal = 0.0

    for j in range(n):  # shape(dataMat):[x, n] x:数据集长度  n:维度

        userRating = dataMat[user, j]  # 取出user这条数据 a = np.array[[1,2,3],[0,2,1]]

        if userRating == 0:                  #   for i in [0,1,2]: print(a[1, i])  # 0 2 1

            continue

        # logical_and----  numpy逻辑与的判断

        # logical_or----  numpy逻辑或的判断

        # logical_not----  numpy逻辑非的判断

        overLap = nonzero(logical_and(dataMat[:, item].A > 0, \

                                     dataMat[:, j].A > 0))[0]

        if len(overLap) == 0:

            similarity = 0

        else:

            similarity = simMeas(dataMat[overLap,item],\

                                 dataMat[overLap,j])

        print('the %d and %d similarity is: %f'%(item, j, similarity))

        simTotal += similarity

        ratSimTotal += similarity * userRating

    if simTotal == 0:

        return 0

    return ratSimTotal/simTotal

# 将一个11纬的矩阵转换成一个5维的矩阵,基于SVD的评3分估计

def svdEst(dataMat, user, simMeas, item):

    n = shape(dataMat)[1]      #获取物品的数量

    simTotal = 0.0; ratSimTotal = 0.0

    U,Sigma, VT = la.svd(dataMat)

    Sig4 = mat(eye(4)*Sigma[:4])

    xformedItems = dataMat.T*U[:,:4]*Sig4.I

    for j in range(n):

        userRating = dataMat[user,j]

        if userRating == 0 or j==item: continue

        similarity = simMeas(xformedItems[item,:].T,\

                            xformedItems[j,:].T)

        print('the %d and %d similarity is:%f'%(item, j, similarity))

        simTotal += similarity

        ratSimTotal += similarity * userRating

    if simTotal == 0:return 0

    else: return ratSimTotal/simTotal

def recommend(dataMat, user, N=3, simMeas=cosSim, estMethod=standEst):

    """

    :param dataMat: 测试数据集， ex loadExData1()

    :param user: 用户ID所对应的行号index， ex user=1

    :param N: default N=3 N个推荐结果，默认设为3

    :param simMeas: 默认相关性函数cosSim

    :param estMethod: 默认基于物品相似度的推荐函数standEst

    :return: N个推荐结果

    """

    unratedItems = nonzero(dataMat[user,:].A==0)[1]   #返回user=1行[0,0,0,0,0,0,0,0,0,0,5],中元素为0的列下标

    if len(unratedItems) == 0:

        return 'you rated everything'

    itemScores = []

    for item in unratedItems:  # [0 1 2 3 4 5 6 7 8 9]

        estimatedScore = estMethod(dataMat, user, simMeas, item)

        itemScores.append((item, estimatedScore))

    return sorted(itemScores, key=lambda jj: jj[1], reverse=True)[:N]

if __name__ == '__main__':

    data = mat(loadExData1())

    re = recommend(data, 1)

    print(re)

from django.db import connection

  select_sql = 'select * from model'

    datas = pd.read_sql(select_sql, connection)  # <pandas.core.frame.DataFrame'>

    temp = datas.iloc[:, 2:]  # 取出所有数据的 除了前两个字段

    tp = temp.sum(axis=0)  # 所有字段纵向相加

    top_sorts = tp.sort_values(ascending=False)  # 降序排序

    top3 = top_sorts.index[:4]

    top_recommends = top3.values.tolist()

随机推荐

Spring Cloud(Dalston.SR5)--Eureka 服务实例健康检查
默认情况下,Eureka 客户端每隔 30 秒会发送一次心跳给服务器端,告知正常存活,但是,实际环境中有可能出现这种情况,客户端表面上可以正常发送心跳,但实际上服务是不可用的,例如,一个需要访问数据的 ...
使用zlib来压缩文件-用delphi描述
今天用到压缩文件的问题,找了一些网上的资料,后来发现了delphi自身所带的zlib单元,根据例子稍微改变了一些,使它能够符合所有的格式. 使用时,需要Zlib.pas和 Zlibconst.pas两 ...
XBOX360更新游戏封皮（FSD自制系统）
第一步,请记下上图左下角的IP地址第二步,打开电脑IE浏览器,输入“第二步”你记下的IP地址“回车”然后,就如下图所示了. 输入账号:f3http 密码:f3http 进入,然后你就进到你的360 F ...
CEF中弹出窗口的处理
CEF开发如果不想在弹出窗口中打开网页,即想要在当前窗体加载目标Url, 就需要重写OnBeforePopup,它是属于CefLifeSpanHandler类中的. /*--cef(optional_ ...
模拟a标签click，弹出新页面
$("<a>").attr("href", url).attr("target", "_blank")[0] ...
Windows 使用windump进行循环抓包
准备工作 1.下载tcpdump http://www.winpcap.org/windump/ 2.下载WinPcaphttp://www.winpcap.org/install/bin/WinP ...
Paramiko&堡垒机
Paramiko paramiko模块,基于SSH用于连接远程服务器并执行相关操作. 一.安装 pip install paramiko 二.使用 SSHClient 用于连接远程服务器并执行基本命令 ...
《Java并发编程实战》笔记-Happens-Before规则
Happens-Before规则程序顺序规则.如果程序中操作A在操作B之前,那么在线程中A操作将在B操作之前执行. 监视器锁规则.在监视器锁上的解锁操作必须在同一个监视器锁上的加锁操作之前执行. v ...
hadoop集群部署
1) 安装jdk 下载jdk-6u21-linux-i586.bin 然后修改/etc/profile: export JAVA_HOME=/usr/local/jdk export CLASSPAT ...
[UE4]圆形的动态材质，使用VectorParameter、Get Dynamic Material、Set Vector Parameter Value
一.新建一个名为M_FriendColor的材质.使用VectorParameter函数二.新建一个名为FriendFlag的UserWidget,生成随机颜色,并传递给上一步设置的材质参数Colo ...

推荐算法 pd

推荐算法 pd的更多相关文章

随机推荐

热门专题