租房数据分析,knn算法使用


import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

data = pd.read_excel('jiemo.xls')  # 导入当前文件夹下的58.csv数据文件

df=pd.DataFrame(data)

df1=df.dropna()

df1['平方']=df1['平方'].str.replace("㎡","")

df1['价格/每平方米']=df1['价格']/df1['平方'].astype(int)

d1=df1['地址']

category = pd.Categorical(d1)

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()

le.fit(category)

d1=le.transform(d1)

price = df1['价格/每平方米']

adress = d1

plt.scatter(price, adress)

# x，y取值范围设置

# 可以过滤掉一部分脏数据

# 设置title和x，y轴的label

plt.xlabel("price")

plt.ylabel("adress")

plt.show()

d1=df1['地址']

category = pd.Categorical(d1)

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()

le.fit(category)

d1=le.transform(d1)

print(d1)

d2=df1['朝向']

category = pd.Categorical(d2)

le.fit(category)

d2=le.transform(d2)

print(d2)

d3=df1['类型']

category = pd.Categorical(d3)

le.fit(category)

d3=le.transform(d3)

print(d3)

target=[]

t2=[]

feature=zip(d1,df1['平方'].astype(int),d2,d3)

for i in df1['价格'].astype(int):

    target.append(i)

for i in feature:

    t2.append(i)

[186 163 187 ... 235 231 231]

[31 33 31 ... 33 31 33]

[17 17  5 ... 17  2 39]

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=1)

knn.fit(t2,target)

knn.score(t2,target)

#0.8762793914246196

knn.predict([[167,80,2,2]])

数据地址:

链接：https://pan.baidu.com/s/1vxt87sgEHFYjCmuyUPPVHg
提取码：eo90
复制这段内容后打开百度网盘手机App，操作更方便哦

租房数据分析,knn算法使用的更多相关文章

腾讯公司数据分析岗位的hadoop工作　线性回归　k-means算法　朴素贝叶斯算法　SpringMVC组件　某公司的广告投放系统　KNN算法　社交网络模型　SpringMVC注解方式
腾讯公司数据分析岗位的hadoop工作线性回归 k-means算法朴素贝叶斯算法 SpringMVC组件某公司的广告投放系统 KNN算法社交网络模型 SpringMVC注解方式某移动公司实时 ...
数据分析与挖掘 - R语言：KNN算法
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. KNN算法步骤:需对所有样本点(已知分类+未知分类)进行归一化处理.然后,对未知分 ...
机器学习——KNN算法（k近邻算法）
一 KNN算法 1. KNN算法简介 KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分 ...
机器学习实战（笔记）------------KNN算法
1.KNN算法 KNN算法即K-临近算法,采用测量不同特征值之间的距离的方法进行分类. 以二维情况举例: 假设一条样本含有两个特征.将这两种特征进行数值化,我们就可以假设这两种特种分别 ...
ML(5):KNN算法
K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,可以简单的理解为由那离自己最近的K个点来投票决定待分类数据归为哪一类.这个算法是机器学习里面一个比较经典的算法, ...
吴裕雄--天生自然python机器学习实战：K-NN算法约会网站好友喜好预测以及手写数字预测分类实验
实验设备与软件环境硬件环境:内存ddr3 4G及以上的x86架构主机一部系统环境:windows 软件环境:Anaconda2(64位),python3.5,jupyter 内核版本:window ...
【Machine Learning】KNN算法虹膜图片识别
K-近邻算法虹膜图片识别实战作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
KNN算法
1.算法讲解 KNN算法是一个最基本.最简单的有监督算法,基本思路就是给定一个样本,先通过距离计算,得到这个样本最近的topK个样本,然后根据这topK个样本的标签,投票决定给定样本的标签: 训练过程 ...
kNN算法python实现和简单数字识别
kNN算法算法优缺点: 优点:精度高.对异常值不敏感.无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路: KNN算法(全称K最近邻算法),算法的思想很简单 ...

随机推荐

Visual Studio Code 下载安装
1.官网下载:https://code.visualstudio.com/ 2.下载完成后,点开如果是黑屏的话,右键勾上.
阿里云前端路线 | CSS快速掌握
1.1什么是CSS 翻译为“层叠样式表”或者“级联样式表”, 简称样式表. 1.2CSS的主要作用它主要是用来给HTML网页来设置外观或者样式外观或者样式:HTML网页中的文字的大小.颜色.字体, ...
Android组件化 + MVP + MVVM
前言组件化和插件化已经提出了很久了,到现在也是比较稳定的一种架构方案了,在三年前,组件化和插件提出来没多久,前公司就已经在项目中使用了,只是当时还只是菜鸟,没有资格参与到架构的建设中,只是在大佬搭好 ...
vue 实现页面跳转
首先,vue项目文件夹如下: components下有两个.vue文件,HelloWorld为创建时自动建立的,login需要自己创建的,login页面效果如下: 首先实现登录按钮的跳转,先对inde ...
C#类库推荐拼多多.Net SDK，开源免费！
背景介绍近两年拼多多的发展非常迅速,即便口碑一般,也没有网页端,奈何我们已经全面小康,6亿月收入1000以下,9亿月收入2000以下,所以因为价格原因使用拼多多的用户也越来越多了.同样的,拼多多也开 ...
linux定时删除过期文件
需求说明每日凌晨0点定时删除/temp目录下的所有一个月未被访问的文件. 脚本实现 linux 终端输入crontab -e,添加定时任务脚本命令 [root@localhost ~]# cront ...
我告诉你一个 AtomicInteger 的惊天大秘密
i++ 不是线程安全的操作,因为它不是一个原子性操作. 那么,如果我想要达到类似 i++ 的这种效果,我应该使用哪些集合或者说工具类呢? 在 JDK1.5 之前,为了确保在多线程下对某基本数据类型或者 ...
Spring循环依赖的三种方式
引言:循环依赖就是N个类中循环嵌套引用,如果在日常开发中我们用new 对象的方式发生这种循环依赖的话程序会在运行时一直循环调用,直至内存溢出报错.下面说一下Spring是如果解决循环依赖的. 第一 ...
微服务实战系列（二）-注册中心Springcloud Eureka客户端
1. 场景描述前几天介绍了下springcloud的Eureka注册中心(springcloud-注册中心快速构建),今天结合springboot-web介绍下eureka客户端服务注册. 2. 解 ...
pwnable.kr-cmd2-witeup
程序清除了环境变量,解决对策是使用绝对地址使用各种命令和文件. 程序的过滤策略更加严格,过滤了/.天哪,使用绝对路径必用/,怎么办咩? 解决办法是使用pwd变量,它会显示当前目录,然而在/目录下执行此 ...

租房数据分析,knn算法使用

租房数据分析,knn算法使用的更多相关文章

随机推荐

热门专题