C语言实现knn

以后写代码一定要谨慎，提高代码的正确率。

/***************************************

 * 1.初始化距离为最大值

 * 2.计算未知样本和每个训练样本的距离为dist

 * 3.得到目前k个最邻近样本中的最大距离maxdist

 * 4.如果dist小于maxdist，则将改训练样本作为k-最近邻样本

 * 5.重复2、3、4，直至未知样本和训练样本的距离都算完

 * 6.统计k个最近邻样本中每个类别出现的次数

 * 7.选择出现频率最大的类别作为未知样本的类别

 * *****************************************/

#include <stdio.h>

#include <math.h>

#include <stdlib.h>

#include <string.h>

#define MAX 0x7fffffff

#define K 3

double  cal_dist(int n,double *x,double *y)

{

    double sum = 0.0;

    int i =;

    for(i=;i<n;i++)

    {

        sum += pow((x[i]-y[i]),2.0);

    }

    return sqrt(sum);

}

void bubbleSort(double **array,int count,int flag)

{

    int i = count,j;

    double temp;

    while(i>)

    {

        for(j=;j<i-;j++)

        {

            if(flag == )

            {

                if(array[][j] > array[][j+])

                {

                    temp = array[][j];

                    array[][j] = array[][j+];

                    array[][j+] = temp;

                    temp = array[][j];

                    array[][j] = array[][j+];

                    array[][j+] = temp;

                }

            }

            else if(flag == )

            {

                if(array[][j] > array[][j+])

                {

                    temp = array[][j];

                    array[][j] = array[][j+];

                    array[][j+] = temp;

                    temp = array[][j];

                    array[][j] = array[][j+];

                    array[][j+] = temp;

                }

            }

        }

        i--;

    }

    return;

}

int main()

{

    int n,m;

    FILE *fp;

    fp = fopen("/data.txt","r");

    fscanf(fp,"N=%d,D=%d",&n,&m);

    printf("N=%d,D=%d\n",n,m);

    double  **array;

    array = (double **)malloc(n*sizeof(double));

    array[] = (double *)malloc(n*m*sizeof(double));

    int h,j = ,i =;

    for(i=;i<n;i++)

    {

        array[i] = array[i-] + m;

    }

    for(i=;i<n;i++)

    {

        for(j=;j<m;j++)

        {

            fscanf(fp,"%lf",&array[i][j]);

        }

    }

    double **temp;

    temp = (double **)malloc(*sizeof(double));

    temp[] = (double *)malloc(*K*sizeof(double));

    for(i=;i<;i++)

    {

        temp[i] = temp[i-] + K;

    }

    for(i=;i<;i++)

    {

        for(j=;j<K;j++)

        {

            temp[i][j] = MAX*0.1;

        }

    }

    double *testdata;

    double max_dist = 0.0;

    double distance = 0.0;

    double tmp = 0.0;

    testdata=(double *)malloc((m-)*sizeof(double));

    printf("input test data containing %d numbers:\n",m-);

    for(i=;i<(m-);i++)

    {

            fscanf(fp,"%lf",&testdata[i]);

    }

    close(fp);

    while()

    {

        for(i=;i<K;i++)

        {

            if(K > n) break;

            temp[][i] = cal_dist(n,testdata,array[i]);

            temp[][i] = array[i][m-];

        }

        for(i=;i<K;i++)

        {

            printf("%4lf,%4lf\n",temp[][i],temp[][i]);

        }

        printf("\n");

        bubbleSort(temp,K,);

        max_dist = temp[][K-];

        for(i=K;i<n;i++)

        {

            distance = cal_dist(n,testdata,array[i]);

            if(max_dist > distance)

            {

                for(j=;j<K;j++)

                {

                    if(distance < temp[][j])

                    {

                        for(h=K-;h>j;h--)

                        {

                            temp[][h] = temp[][h-];

                            temp[][h] = temp[][h-];

                        }

                    }

                    temp[][j] = distance;

                    temp[][j] = array[i][m-];

                }

            }

            max_dist = temp[][K-];

        }

        bubbleSort(temp,K,);

        break;

    }

    int value_label = ;

    int count = ;

    int flag = ;

    for(i=;i<K-;i++)

    {

        if(temp[][i] != temp[][i+])

        {

            if(flag > count)

            {

                flag = count;

                value_label = temp[][i];

                count =;

            }

        }

        else

        {

            count ++;

        }

    }

    if(count > flag)

    {

        value_label = temp[][K-];

        flag = count;

    }

    printf("Predict message is %d\n",value_label);

    return ;

}

C语言实现knn的更多相关文章

机器学习与R语言：kNN
#---------------------------------------- # 功能描述:演示kNN建模过程 # 数据集:威斯康星乳腺癌诊断 # #---------------------- ...
数据分析与挖掘 - R语言：KNN算法
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. KNN算法步骤:需对所有样本点(已知分类+未知分类)进行归一化处理.然后,对未知分 ...
大数据时代的精准数据挖掘——使用R语言
老师简介: Gino老师,即将步入不惑之年,早年获得名校数学与应用数学专业学士和统计学专业硕士,有海外学习和工作的经历,近二十年来一直进行着数据分析的理论和实践,数学.统计和计算机功底强悍. 曾在某一 ...
机器学习第五篇：分类（kNN）
K最近邻(kNN,k-NearestNeighbor)算法是一种监督式的分类方法,但是,它并不存在单独的训练过程,在分类方法中属于惰性学习法,也就是说,当给定一个训练数据集时,惰性学习法简单地存储或稍 ...
kd树和knn算法的c语言实现
基于kd树的knn的实现原理可以参考文末的链接,都是一些好文章. 这里参考了别人的代码.用c语言写的包括kd树的构建与查找k近邻的程序. code: #include<stdio.h> # ...
【机器学*与R语言】2-懒惰学*K*邻（kNN）
目录 1.理解使用KNN进行分类 KNN特点 KNN步骤 1)计算距离 2)选择合适的K 3)数据准备 2.用KNN诊断乳腺癌 1)收集数据 2)探索和准备数据 3)训练模型 4)评估模型的性能 5) ...
k近邻算法(knn)的c语言实现
最近在看knn算法,顺便敲敲代码. knn属于数据挖掘的分类算法.基本思想是在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别.俗话叫,"随大流&q ...
用R语言对一个信用卡数据实现logit,GBM,knn,xgboost
Prepare the data 数据来自UCIhttp://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening,一个 ...
knn算法的c语言实现
最近研究KNN,找到了一些优秀的源码,贴出来,做个笔记吧. #include<stdio.h> #include<stdlib.h> #include<math.h> ...

随机推荐

mysql互为主从复制配置笔记--未读，稍后学习
MySQL-master1:192.168.72.128 MySQL-master2:192.168.72.129 OS版本:CentOS 5.4MySQL版本:5.5.9(主从复制的master和s ...
Hbase(一)基础知识
一.Hbase数据库介绍 1.简介 HBase 是 BigTable 的开源 java 版本.是建立在 HDFS 之上,提供高可靠性.高性能.列存储. 可伸缩.实时读写 NoSQL 的数据库系统. N ...
SpringMVC接收复杂集合对象（参数）代码示例
原文: https://www.jb51.net/article/128233.htm SpringMVC接收复杂集合对象(参数)代码示例更新时间:2017年11月15日 09:18:15 作者 ...
Servlet3.0 新特性
Servlet3.0 的注解 Servlet 允许开发人员采用注解的方式来配置 Servlet.Filter.Listener. Servlet3.0 规范在 javax.servlet.annota ...
简单的并发服务器（多个线程各自accept）
基于之前讲述的简单循环服务器,做一个多个线程各自accept的服务器demo 由于多个线程各自accept,容易造成数据错误,需要在accept前后枷锁先看下客户端客户端创建socket,初始化服 ...
Tensorboard教程：监控指标可视化
Tensorflow监控指标可视化觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献强烈推荐Tensorflow实战Google深度学习框架实验平台: Tensorflow1.4. ...
解决问题Can’t connect to local MySQL server through socket
不幸遇到MySQL出现ERROR 2002 (HY000): Can’t connect to local mysql server through socket ‘/tmp/mysql.sock’错 ...
User-Agent大全
一.基础知识篇: Http Header之User-Agent User Agent中文名为用户代理,是Http协议中的一部分,属于头域的组成部分,User Agent也简称UA.它是一个特殊字符串头 ...
JVM调优总结（4）：分代垃圾回收
为什么要分代分代的垃圾回收策略,是基于这样一个事实:不同的对象的生命周期是不一样的.因此,不同生命周期的对象可以采取不同的收集方式,以便提高回收效率. 在Java程序运行的过程中,会产生大量的对象, ...
【Codeforces811E】Vladik and Entertaining Flags [线段树][并查集]
Vladik and Entertaining Flags Time Limit: 20 Sec Memory Limit: 512 MB Description n * m的矩形,每个格子上有一个 ...

C语言实现knn

C语言实现knn的更多相关文章

随机推荐

热门专题