吴裕雄 python 机器学习——密度聚类DBSCAN模型

import numpy as np

import matplotlib.pyplot as plt

from sklearn import  cluster

from sklearn.metrics import adjusted_rand_score

from sklearn.datasets.samples_generator import make_blobs

def create_data(centers,num=100,std=0.7):

    X, labels_true = make_blobs(n_samples=num, centers=centers, cluster_std=std)

    return  X,labels_true

#密度聚类DBSCAN模型

def test_DBSCAN(*data):

    X,labels_true=data

    clst=cluster.DBSCAN()

    predicted_labels=clst.fit_predict(X)

    print("ARI:%s"% adjusted_rand_score(labels_true,predicted_labels))

    print("Core sample num:%d"%len(clst.core_sample_indices_))

# 用于产生聚类的中心点

centers=[[1,1],[2,2],[1,2],[10,20]]

# 产生用于聚类的数据集

X,labels_true=create_data(centers,1000,0.5)

#  调用 test_DBSCAN 函数

test_DBSCAN(X,labels_true)

def test_DBSCAN_epsilon(*data):

    '''

    测试 DBSCAN 的聚类结果随  eps 参数的影响

    '''

    X,labels_true=data

    epsilons=np.logspace(-1,1.5)

    ARIs=[]

    Core_nums=[]

    for epsilon in epsilons:

        clst=cluster.DBSCAN(eps=epsilon)

        predicted_labels=clst.fit_predict(X)

        ARIs.append( adjusted_rand_score(labels_true,predicted_labels))

        Core_nums.append(len(clst.core_sample_indices_))

    ## 绘图

    fig=plt.figure()

    ax=fig.add_subplot(1,2,1)

    ax.plot(epsilons,ARIs,marker='+')

    ax.set_xscale('log')

    ax.set_xlabel(r"$\epsilon$")

    ax.set_ylim(0,1)

    ax.set_ylabel('ARI')

    ax=fig.add_subplot(1,2,2)

    ax.plot(epsilons,Core_nums,marker='o')

    ax.set_xscale('log')

    ax.set_xlabel(r"$\epsilon$")

    ax.set_ylabel('Core_Nums')

    fig.suptitle("DBSCAN")

    plt.show()

#  调用 test_DBSCAN_epsilon 函数

test_DBSCAN_epsilon(X,labels_true)

def test_DBSCAN_min_samples(*data):

    '''

    测试 DBSCAN 的聚类结果随  min_samples 参数的影响

    '''

    X,labels_true=data

    min_samples=range(1,100)

    ARIs=[]

    Core_nums=[]

    for num in min_samples:

        clst=cluster.DBSCAN(min_samples=num)

        predicted_labels=clst.fit_predict(X)

        ARIs.append( adjusted_rand_score(labels_true,predicted_labels))

        Core_nums.append(len(clst.core_sample_indices_))

    ## 绘图

    fig=plt.figure()

    ax=fig.add_subplot(1,2,1)

    ax.plot(min_samples,ARIs,marker='+')

    ax.set_xlabel( "min_samples")

    ax.set_ylim(0,1)

    ax.set_ylabel('ARI')

    ax=fig.add_subplot(1,2,2)

    ax.plot(min_samples,Core_nums,marker='o')

    ax.set_xlabel( "min_samples")

    ax.set_ylabel('Core_Nums')

    fig.suptitle("DBSCAN")

    plt.show()

#  调用 test_DBSCAN_min_samples 函数

test_DBSCAN_min_samples(X,labels_true)

吴裕雄 python 机器学习——密度聚类DBSCAN模型的更多相关文章

吴裕雄 python 机器学习——层次聚类AgglomerativeClustering模型
import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics ...
吴裕雄 python 机器学习——支持向量机非线性回归SVR模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...
吴裕雄 python 机器学习——KNN回归KNeighborsRegressor模型
import numpy as np import matplotlib.pyplot as plt from sklearn import neighbors, datasets from skle ...
吴裕雄 python 机器学习——KNN分类KNeighborsClassifier模型
import numpy as np import matplotlib.pyplot as plt from sklearn import neighbors, datasets from skle ...
吴裕雄 python 机器学习——半监督学习LabelSpreading模型
import numpy as np import matplotlib.pyplot as plt from sklearn import metrics from sklearn import d ...
吴裕雄 python 机器学习——支持向量机线性回归SVR模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...
吴裕雄 python 机器学习——混合高斯聚类GMM模型
import numpy as np import matplotlib.pyplot as plt from sklearn import mixture from sklearn.metrics ...
吴裕雄 python 机器学习——K均值聚类KMeans模型
import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics ...
吴裕雄 python 机器学习——分类决策树模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.model_s ...

随机推荐

duck typing
在程序设计中,鸭子类型(英语:duck typing)是动态类型的一种风格.在这种风格中,一个对象有效的语义,不是由继承自特定的类或实现特定的接口,而是由"当前方法和属性的集合"决 ...
浅谈块元素绝对定位的margin属性
对于div的绝对定位一直以为margin属性是无效的,只是通过top,left,bottom,right定位,然而今天的却发现不是这样的,于是对其做了些实验: 使用的HTML原始测试文件: <! ...
【HDU5391】Zball in Tina Town
[题目大意] 一个球初始体积为1,一天天变大,第一天变大1倍,第二天变大2倍,第n天变大n倍.问当第 n-1天的时候,体积变为多少.注意答案对n取模. [题解] 根据威尔逊定理:(n-1)! mod ...
供参考的 php 学习路线
供参考的 php 学习路线第一阶段第一讲,WEB基础 1.1 网站基本知识: 1.2 网络协议介绍: 1.3 B/S与C/S结构的区别: 1.4 WEB编程.网站开发技术介绍. ...
c++ deque 容器
deque (全名 double ended queue)是一种具有队列和栈一样的数据结构. 在c++标准库中几乎和vector容器的接口完全相同,但它和vector 还是有一些细微的差别. 1. d ...
c# 获取客户端ip、mac、机器名、操作系统、浏览器信息
d using System; using System.Collections.Generic; using System.Linq; using System.Web; using System. ...
UOJ#22. 【UR #1】外星人
传送门分析我们发现一个很神的性质,就是对于一个数如果放在它之前的数小于它那它一定对答案没有贡献于是我们用dp[i][j]表示从大往小考虑了前i个数,当前答案是j的方案数我们知道它由两种情况转移 ...
Odometry的发布和发布odom到base_link的tf变换
转载自http://www.ncnynl.com/archives/201702/1328.html ROS发布nav_msgs/Odometry消息,以及通过tf从“odom”坐标系到“base_l ...
Part5核心初始化_lesson3---关闭看门狗
1.看门狗---作用 2.看门狗工作方式 3.原理图时钟源来自于PCLK经过分频器,经过选择器,输出到作为看门狗定时器,WTDAT为一个预载值,当它计数为零的时候,还没有给WTDAT赋值,那么它会发 ...
bootstrap强调类名
1. .lead .lead { margin-bottom: 20px; font-size: 16px; font-weight: 200; line-height: 1.4; } @medi ...

吴裕雄 python 机器学习——密度聚类DBSCAN模型

吴裕雄 python 机器学习——密度聚类DBSCAN模型的更多相关文章

随机推荐

热门专题