Classifying urban land use by integrating remote sensing and social media data   Xiaoping Liu, Jialv He, Yao Yao, Jinbao Zhang, Haolin Liang, Huan Wang & YeHong 摘要 研究方向的重要性(有意义): 城市土地使用信息在城市管理.政府政策制定.和人类活动监测方面扮演着重要的角色. However,存在的困难: 由于城市系统的复杂性,将城市功能…
简单易学的机器学习算法-基于密度的聚类算法DBSCAN 一.基于密度的聚类算法的概述 我想了解下基于密度的聚类算法,熟悉下基于密度的聚类算法与基于距离的聚类算法,如K-Means算法之间的区别.     基于密度的聚类算法主要的目标是寻找被低密度区域分离的高密度区域.与基于距离的聚类算法不同的是,基于距离的聚类算法的聚类结果是球状的簇,而基于密度的聚类算法可以发现任意形状的聚类,这对于带有噪音点的数据起着重要的作用. 二.DBSCAN算法的原理 1.基本概念     DBSCAN(Density…
一.基于密度的聚类算法的概述     最近在Science上的一篇基于密度的聚类算法<Clustering by fast search and find of density peaks>引起了大家的关注(在我的博文“论文中的机器学习算法——基于密度峰值的聚类算法”中也进行了中文的描述).于是我就想了解下基于密度的聚类算法,熟悉下基于密度的聚类算法与基于距离的聚类算法,如K-Means算法之间的区别.     基于密度的聚类算法主要的目标是寻找被低密度区域分离的高密度区域.与基于距离的聚类算…
https://mlnote.wordpress.com/2015/12/16/python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%AE%9E%E8%B7%B5%E4%B8%8Ekaggle%E5%AE%9E%E6%88%98-machine-learning-for-kaggle-competition-in-python/ Author: Miao Fan (范淼), Ph.D. candidate on Computer Science. Affil…
Python机器学习实践指南 目 录 第1章Python机器学习的生态系统 1 1.1 数据科学/机器学习的工作 流程 2 1.1.1 获取 2 1.1.2 检查和探索 2 1.1.3 清理和准备 3 1.1.4 建模 3 1.1.5 评估 3 1.1.6 部署 3 1.2 Python库和功能 3 1.2.1 获取 4 1.2.2 检查 4 1.2.3 准备 20 1.2.4 建模和评估 26 1.2.5 部署 34 1.3 设置机器学习的环境 34 1.4 小结 34 第2章构建应用程序,发…
 发布于 2014-06-30 作者 刘 天栋 对于架设可协同作业的网站平台, Windows  Azure有着得天独厚的优势.这不仅在于其强大的扩展性和安全性,更重要的是 Azure 平台对各类网站,内容管理以及项目协同管理方案的支持与开放.各类开源技术,均可以稳健的运行在这个强大的平台上,并且不断延伸扩展. 在这一周的博文中,我想向大家介绍 VM Depot 中已经包含的各类相关解决方案.和往常一样,让我来为您交流点评其中的几个经典镜像,希望您能有所收获. //社交媒体与内容管理平台//…
编辑人员注释:今天这篇文章由 Pruffi 创始人 Alena Vladimirskaya 和 Pruffi 的 CTO Alexander Ivanov 联合撰写,介绍了该公司如何使用 Windows Azure 来支持其 Pruffi Graph 和 Pruffi Friends 社交媒体服务. Pruffi 致力于开发可利用社交媒体强大功能的 Web 和移动应用程序,以帮助求职者找到适合的职位,同时帮助招聘经理.HR 专员和招聘机构找到符合资格的应聘者.Pruffi 总部位于俄罗斯莫斯科,…
一.应用场景 曾几何时,社交媒体已经驻扎到了几乎每个人的生活中.看看你身边的朋友,有几个不玩朋友圈的?就算他不玩朋友圈,那也得玩微博吧.再没有底线,也得玩QQ空间. 不过,作为程序员的我们,没事还是少上这些社交媒体为妙.反而,我们应该去考虑--如何实现这些社交媒体的开发呢? 我相信一定有不少朋友跟我一样,思考过这个问题,今天我就把自己的成果分享给大家,不一定完美,但求抛砖引玉,请大家多指教! 二.运行效果 下面是我做好的PC端和安卓端的运行界面.让大家先有一个直观的了解.后面我会进一步分享我设计…
使用google翻译自:https://software.seek.intel.com/dealing-with-outliers 数据分析中的一项具有挑战性但非常重要的任务是处理异常值.我们通常将异常值定义为与其余数据群1不一致的样本或事件.异常值通常包含有关影响数据生成过程2的系统和实体的异常特征的有用信息. 异常检测算法的常见应用包括: 入侵检测系统信用卡诈骗有趣的传感器事件医学诊断在本文中,我们将重点介绍异常检测 - 信用卡欺诈的最常见应用之一.通过一些简单的离群值检测方法,可以在真实世…
基于聚类的“图像分割” 参考网站: https://zhuanlan.zhihu.com/p/27365576 昨天萌新使用的是PIL这个库,今天发现机器学习也可以这样玩. 视频地址Python机器学习应用 图像分割:利用图像的灰度.颜色.纹理.形状等特征,把图像分成若 干个互不重叠的区域,并使这些特征在同一区域内呈现相似性,在不同的区 域之间存在明显的差异性.然后就可以将分割的图像中具有独特性质的区域 提取出来用于不同的研究. 实现步骤: 1.建立工程并导入sklearn包 2.加载图片并进行…