k-mean

import numpy as np

from k_initialize_cluster import k_init

np.random.seed()

class YOLO_Kmeans:

def __init__(self, cluster_number, filename):

    self.cluster_number = cluster_number

    self.filename = "train.txt"

def iou(self, boxes, clusters):  # 1 box -> k clusters

    n = boxes.shape[0]

    k = self.cluster_number

    box_area = boxes[:, 0] * boxes[:, 1]

    box_area = box_area.repeat(k)

    box_area = np.reshape(box_area, (n, k))

    cluster_area = clusters[:, 0] * clusters[:, 1]

    cluster_area = np.tile(cluster_area, [1, n])

    cluster_area = np.reshape(cluster_area, (n, k))

    box_w_matrix = np.reshape(boxes[:, 0].repeat(k), (n, k))

    cluster_w_matrix = np.reshape(np.tile(clusters[:, 0], (1, n)), (n, k))

    min_w_matrix = np.minimum(cluster_w_matrix, box_w_matrix)

    box_h_matrix = np.reshape(boxes[:, 1].repeat(k), (n, k))

    cluster_h_matrix = np.reshape(np.tile(clusters[:, 1], (1, n)), (n, k))

    min_h_matrix = np.minimum(cluster_h_matrix, box_h_matrix)

    inter_area = np.multiply(min_w_matrix, min_h_matrix)

    result = inter_area / (box_area + cluster_area - inter_area)

    return result

def avg_iou(self, boxes, clusters):

    accuracy = np.mean([np.max(self.iou(boxes, clusters), axis=1)])

    return accuracy

def kmeans(self, boxes, k, dist=np.median):

    box_number = boxes.shape[0]

    distances = np.empty((box_number, k))#18 * 9

    last_nearest = np.zeros((box_number,))#18

    # np.random.seed()

    #初始化kmeans均值

    # clusters = k_init(boxes,k)

    # print("cluster:",clusters)

    # clusters =  np.array(clusters)

    clusters = boxes[np.random.choice(

        box_number, k, replace=False)]  # init k clusters

    while True:

        distances = 1 - self.iou(boxes, clusters)#18*9

        current_nearest = np.argmin(distances, axis=1)

        if (last_nearest == current_nearest).all():

            break  # clusters won't change

        for cluster in range(k):

            clusters[cluster] = dist(  # update clusters

                boxes[current_nearest == cluster], axis=0)

        last_nearest = current_nearest

    return clusters

def result2txt(self, data):

    f = open("yolo_anchors.txt", 'w')

    row = np.shape(data)[0]

    for i in range(row):

        if i == 0:

            x_y = "%d,%d" % (data[i][0], data[i][1])

        else:

            x_y = ", %d,%d" % (data[i][0], data[i][1])

        f.write(x_y)

    f.close()

def txt2boxes(self):

    f = open(self.filename, 'r')

    dataSet = []

    for line in f:

        infos = line.split(" ")

        length = len(infos)

        for i in range(1, length):

            width = int(infos[i].split(",")[2]) - \

                int(infos[i].split(",")[0])

            height = int(infos[i].split(",")[3]) - \

                int(infos[i].split(",")[1])

            dataSet.append([width, height])

            print("i",i)

    result = np.array(dataSet)

    f.close()

    return result

def txt2clusters(self):

    all_boxes = self.txt2boxes()

    result = self.kmeans(all_boxes, k=self.cluster_number)

    result = result[np.lexsort(result.T[0, None])]

    self.result2txt(result)

    print("K anchors:\n {}".format(result))

    print("Accuracy: {:.2f}%".format(

        self.avg_iou(all_boxes, result) * 100))

if name == "main":

cluster_number = 9

filename = "train.txt"

kmeans = YOLO_Kmeans(cluster_number, filename)

print("kmeans:",kmeans)

kmeans.txt2clusters()

print("stop:")

k-mean的更多相关文章

django模型操作
Django-Model操作数据库(增删改查.连表结构) 一.数据库操作 1.创建model表
基于改进人工蜂群算法的K均值聚类算法（附MATLAB版源代码）
其实一直以来也没有准备在园子里发这样的文章,相对来说,算法改进放在园子里还是会稍稍显得格格不入.但是最近邮箱收到的几封邮件让我觉得有必要通过我的博客把过去做过的东西分享出去更给更多需要的人.从论文刊登 ...
【开源】专业K线绘制[K线主副图、趋势图、成交量、滚动、放大缩小、MACD、KDJ等）
这是一个iOS项目雅黑深邃的K线的绘制. 实现功能包括K线主副图.趋势图.成交量.滚动.放大缩小.MACD.KDJ,长按显示辅助线等功能预览图最后的最后,这是项目的开源地址:https://git ...
找到第k个最小元----快速选择
此算法借用快速排序算法. 这个快速选择算法主要利用递归调用,数组存储方式.包含3个文件,头文件QuickSelect.h,库函数QuickSelect.c,测试文件TestQuickSelect. 其 ...
BZOJ 3110: [Zjoi2013]K大数查询 [树套树]
3110: [Zjoi2013]K大数查询 Time Limit: 20 Sec Memory Limit: 512 MBSubmit: 6050 Solved: 2007[Submit][Sta ...
二次剩余、三次剩余、k次剩余
今天研究了一下这块内容...首先是板子 #include <iostream> #include <stdio.h> #include <math.h> #incl ...
[LeetCode] Longest Substring with At Least K Repeating Characters 至少有K个重复字符的最长子字符串
Find the length of the longest substring T of a given string (consists of lowercase letters only) su ...
K近邻法(KNN)原理小结
K近邻法(k-nearst neighbors,KNN)是一种很基本的机器学习方法了,在我们平常的生活中也会不自主的应用.比如,我们判断一个人的人品,只需要观察他来往最密切的几个人的人品好坏就可以得出 ...
YYStock开源----iOS股票K线绘制第二版
新的股票绘制粗来啦,欢迎围观star的说(*^__^*) 嘻嘻-- 捏合功能也准备完善了 Github:https://github.com/yate1996/YYStock 长按分时图+五档图分时 ...
k近邻算法(knn)的c语言实现
最近在看knn算法,顺便敲敲代码. knn属于数据挖掘的分类算法.基本思想是在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别.俗话叫,"随大流&q ...

随机推荐

Effective.Java第1-11条
1. 考虑使用静态工厂方法替代构造方法一个类可以提供一个公共静态工厂方法,它只是返回类实例的静态方法.例如JDK的Boolean的valueOf方法: public final class Bool ...
解决新版本R3.6.0不能加载devtools包问题
首先是看到下面这个文章想试着练习一下,结果第一步就卡住了,无法加载devtools包,繁体字都冒出来了......汗!(没有截图,但过程痛苦不堪~) https://www.sohu.com/a/12 ...
ubuntu18 docker中部署ELK
ELK是ElasticSearch.Logstash.Kibana的简称,一般用于日志系统,从日志收集,日志转储,日志展示等入手,用以提供简洁高效的日志处理机制. 鉴于没有额外的机器,这里就用dock ...
JAVA8的java.util.function包 @FunctionalInterface
1 函数式接口java.util.function https://www.cnblogs.com/CobwebSong/p/9593313.html 2 JAVA8的java.util.functi ...
在excel实现多级联动
最近做了一个Excel的多级联动的功能,具体是将全国所有的气象局按一二三四级单位做成四列,实现各级的联动下拉选择,这和省市县乡的各级联动的功能基本一样,下面记录下具体的操作步骤. 1.首先需要从数据库 ...
2019 263云通信java面试笔试题（含面试题解析）
本人5年开发经验.18年年底开始跑路找工作,在互联网寒冬下成功拿到阿里巴巴.今日头条.263云通信等公司offer,岗位是Java后端开发,因为发展原因最终选择去了263云通信,入职一年时间了,也 ...
2019 头条java面试笔试总结（含面试题解析）
本人5年开发经验.18年年底开始跑路找工作,在互联网寒冬下成功拿到阿里巴巴.今日头条等公司offer,岗位是Java后端开发,因为发展原因最终选择去了头条,入职一年时间了,也成为了面试官,之前面 ...
word,excel,ppt转pdf
第一步需要下载jar包和jacob-1.14.3-x64.dll * <dependency> * <groupId>net.sf.jacob-project</gro ...
87.CSS Flex 弹性盒模型布局教程（共用的css在48篇文章gird）
CSS Flex 弹性盒模型布局教程 Flex 是 Flexible Box 的缩写,意为"弹性布局",用来为盒状模型提供最大的灵活性. flex布局就是给任何一个容器添加 dis ...
MySQL导入数据报错Got a packet bigger than‘max_allowed_packet’bytes错误的解决方法
由于max_allowed_packet的值设置过小的原因,只需要将max_allowed_packet值设置大一点就OK了.通过终端进入mysql控制台,输入如下命令可以查看max_allowed_ ...

k-mean

k-mean的更多相关文章

随机推荐

热门专题