租房数据分析,knn算法使用


import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

data = pd.read_excel('jiemo.xls')  # 导入当前文件夹下的58.csv数据文件

df=pd.DataFrame(data)

df1=df.dropna()

df1['平方']=df1['平方'].str.replace("㎡","")

df1['价格/每平方米']=df1['价格']/df1['平方'].astype(int)

d1=df1['地址']

category = pd.Categorical(d1)

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()

le.fit(category)

d1=le.transform(d1)

price = df1['价格/每平方米']

adress = d1

plt.scatter(price, adress)

# x，y取值范围设置

# 可以过滤掉一部分脏数据

# 设置title和x，y轴的label

plt.xlabel("price")

plt.ylabel("adress")

plt.show()

d1=df1['地址']

category = pd.Categorical(d1)

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()

le.fit(category)

d1=le.transform(d1)

print(d1)

d2=df1['朝向']

category = pd.Categorical(d2)

le.fit(category)

d2=le.transform(d2)

print(d2)

d3=df1['类型']

category = pd.Categorical(d3)

le.fit(category)

d3=le.transform(d3)

print(d3)

target=[]

t2=[]

feature=zip(d1,df1['平方'].astype(int),d2,d3)

for i in df1['价格'].astype(int):

    target.append(i)

for i in feature:

    t2.append(i)

[186 163 187 ... 235 231 231]

[31 33 31 ... 33 31 33]

[17 17  5 ... 17  2 39]

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=1)

knn.fit(t2,target)

knn.score(t2,target)

#0.8762793914246196

knn.predict([[167,80,2,2]])

数据地址:

链接：https://pan.baidu.com/s/1vxt87sgEHFYjCmuyUPPVHg
提取码：eo90
复制这段内容后打开百度网盘手机App，操作更方便哦

租房数据分析,knn算法使用的更多相关文章

腾讯公司数据分析岗位的hadoop工作　线性回归　k-means算法　朴素贝叶斯算法　SpringMVC组件　某公司的广告投放系统　KNN算法　社交网络模型　SpringMVC注解方式
腾讯公司数据分析岗位的hadoop工作线性回归 k-means算法朴素贝叶斯算法 SpringMVC组件某公司的广告投放系统 KNN算法社交网络模型 SpringMVC注解方式某移动公司实时 ...
数据分析与挖掘 - R语言：KNN算法
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. KNN算法步骤:需对所有样本点(已知分类+未知分类)进行归一化处理.然后,对未知分 ...
机器学习——KNN算法（k近邻算法）
一 KNN算法 1. KNN算法简介 KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分 ...
机器学习实战（笔记）------------KNN算法
1.KNN算法 KNN算法即K-临近算法,采用测量不同特征值之间的距离的方法进行分类. 以二维情况举例: 假设一条样本含有两个特征.将这两种特征进行数值化,我们就可以假设这两种特种分别 ...
ML(5):KNN算法
K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,可以简单的理解为由那离自己最近的K个点来投票决定待分类数据归为哪一类.这个算法是机器学习里面一个比较经典的算法, ...
吴裕雄--天生自然python机器学习实战：K-NN算法约会网站好友喜好预测以及手写数字预测分类实验
实验设备与软件环境硬件环境:内存ddr3 4G及以上的x86架构主机一部系统环境:windows 软件环境:Anaconda2(64位),python3.5,jupyter 内核版本:window ...
【Machine Learning】KNN算法虹膜图片识别
K-近邻算法虹膜图片识别实战作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
KNN算法
1.算法讲解 KNN算法是一个最基本.最简单的有监督算法,基本思路就是给定一个样本,先通过距离计算,得到这个样本最近的topK个样本,然后根据这topK个样本的标签,投票决定给定样本的标签: 训练过程 ...
kNN算法python实现和简单数字识别
kNN算法算法优缺点: 优点:精度高.对异常值不敏感.无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路: KNN算法(全称K最近邻算法),算法的思想很简单 ...

随机推荐

ICARUS主题美化
Icarus用户指南 - 主题美化 Icarus的主题样式编码文件为themes/icarus/layout/layout.jsx. 此文件定义了站点全局的样式设置.本文详细介绍了本主题针对文章分类的 ...
jenkins iOS自动打包
1.Jenkins配置采用命令行下载配置Jenkins,防止产生权限问题 1)先安装brew,打开命令行,输入:/usr/bin/ruby -e "$(curl -fsSL https:/ ...
eleLogger主题评论区（反馈与建议）
// run $('#blog_post_info, #BlogPostCategory, #post_next_prev, #blog_post_info_block').remove() $('# ...
你想了解的分布式文件系统HDFS，看这一篇就够了
1.分布式文件系统计算机集群结构分布式文件系统把文件分布存储到多个节点(计算机)上,成千上万的计算机节点构成计算机集群. 分布式文件系统使用的计算机集群,其配置都是由普通硬件构成的,与用多个处理器 ...
[leetCode]5. 最长回文子串(DP)
题目给定一个字符串 s,找到 s 中最长的回文子串.你可以假设 s 的最大长度为 1000. 题解 dp.先初始化长度为1和长度为2的串.再依次算长度为3,4,5.... 当找到回文串时,若长度比当 ...
关于java基础_方法的学习
方法: 方法就是把一堆需要反复执行的代码封装起来,如果项目需要调用这段代码时,直接调用方法名即可方法相当于榨汁机, 材料:水果产出物:果汁参数(材料):进入方法的数据返回值(产出物):就是方法 ...
xml的复习
xml的复习 1.概念:可扩展标记语言 2.功能: *存储数据 1.配置文件 2.在网络中传播 3.xml与html区别: xml语法严格,HTML语法松散 xml存储数据,HTML展示 ...
golang slice学习
关于获取slice相关内存地址操作 s := make([]int, 1) t.Log(unsafe.Pointer(&s))// 获取当前slice 结构体实例的内存地址 t.Log(uns ...
Jmeter(二十四) - 从入门到精通 - JMeter函数 - 中篇（详解教程）
1.简介在性能测试中为了真实模拟用户请求,往往我们需要让提交的表单内容每次都发生变化,这个过程叫做参数化.JMeter配置元件与前置处理器都能帮助我们进行参数化,但是都有局限性,为了帮助我们能够更好 ...
JVM学习（五）对象的引用类型
一.引言前面我们学习了JVM的垃圾回收机制,我们知道了垃圾回收是JVM的自发行为:虽然我们可以通过System.gc() 或Runtime.getRuntime().gc()进行显式调用垃圾回收 , ...

租房数据分析,knn算法使用

租房数据分析,knn算法使用的更多相关文章

随机推荐

热门专题