本文对目前主要的出租车、公交车、行人GPS轨迹社交软件签到手机信令等数据产品的获取网站加以整理与介绍。

  本文为“GIS数据获取整理”专栏中第六篇独立博客,因此本文全部标题均由6开头。本文对目前主要的个人GPS轨迹、出租车与公交车GPS轨迹、个人签到与手机信令数据下载网站加以整理与介绍。

6 GPS轨迹与签到数据

6.1 个人GPS轨迹数据

6.1.1 GeoLife GPS Trajectories

  GeoLife GPS Trajectories是微软亚洲研究院(Microsoft Research Asia)Geolife项目生产的182位用户于2007年04月至2012年08月期间的轨迹数据,记录了用户多种户外活动过程中所发生的移动信息。如下图所示。

6.1.2 GPS Trajectories with transportation mode labels

  GPS Trajectories with transportation mode labels同样是微软亚洲研究院(Microsoft Research Asia)Geolife项目生产的数据。而与前者不同的是,本数据中每一个GPS轨迹数据都对应着一个运动类型标签,即都代表对应用户的一种户外行动记录。如下图所示。

6.2 个人签到数据

6.2.1 Gowalla

  Gowalla是斯坦福大学生产的2009年02月至2010年10月期间用户社交媒体软件的签到数据,共有6,442,890条数据。如下图所示。

6.2.2 Gowalla Dataset

  • 网址:已失效

  Gowalla Dataset是在Gowalla基础之上进一步丰富的用户签到数据集。其新增了2010年11月至2010年12月期间用户Facebook签到数据。数据共包含319,063位用户的36,001,959条签到数据。

  不过需要注意,这个Gowalla Dataset目前找不到了——只要访问原网址,会被重定向到一个国外玩扑克的网站,也就是数据网址失效了。当初我第一次写这篇博客的时候肯定还是能打开的,要不然我也不会放进来,但是现在不行了。从这个数据集的原网址域名上看,估计这个数据集是一位名叫yongliu的学者收集或分发的,并用自己的域名分享出来了;但估计是学术太繁忙,其也顾不上维护自己的网站了,所以目前进不去数据地址了。但是这个数据先暂且留着,后面如果又找到了我再更新。

6.3 出租车、公交车GPS轨迹数据

6.3.1 T-Drive

  T-Drive 轨迹数据样本(Trajectory Data Sample)来源于微软,具有北京市2008年02月02日至02月08日共一周时间内10357辆出租车的轨迹数据。其具有约1.5千万个数据点,总行驶里程约900万千米。如下图所示。

6.3.2 The epfl/mobility dataset

  The epfl/mobility dataset包含美国旧金山湾区2008年05月17日至2008年06月10日大约500辆出租车的GPS轨迹数据。如下图所示。

6.3.3 Smart City Research Group

  • 网址:已失效

  Smart City Research Group是香港科技大学生产的城市轨迹数据,包括出租车、公交车、手机社交网络数据等。其中,出租车数据为上海市2007年02月20日单日数据,公交车数据为2007年02月23日数据。

  不过需要注意,这个数据目前也找不到了——只要访问原网址,会被显示无访问权限,也就是数据网址同样失效了。同样从原本的域名分析,这个数据原本应该是课题组通过港科大的Computer Science and Engineering学院官网发布的;现在访问不了的话,估计是课题组取消了数据的公开分享。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。

6.3.4 The roma/taxi dataset

  The roma/taxi dataset包含罗马2014年02月01日至2014年03月02日大约320辆出租车的GPS轨迹数据。如下图所示。

6.3.5 Urban Data Release

  Urban Data Release是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的城市数据集,包括深圳市手机CDR数据、智能卡数据与出租车、公交车轨迹数据。如下图所示。

6.3.6 Electric Vehicle Data

  Electric Vehicle Data是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的电动出租车数据集,包括深圳市单日664辆出租车的1,155,654条GPS数据。如下图所示。

6.3.7 中华人民共和国交通运输部交通智数

  中华人民共和国交通运输部交通智数是中华人民共和国交通运输部下属交通数据分享平台,具有全国多个城市的出租车GPS轨迹数据。如下图所示。

6.3.8 交通线路通达时间预测

  • 网址:已失效

  交通线路通达时间预测是成都一家数据公司主办的数据分析赛事,其提供了成都市2014年08月03日至2014年08月30日1.4万余辆出租车14亿+条GPS记录。报名参赛后即可下载对应数据。

  不过需要注意,这个数据目前也找不到了——这个是当初一个数据分析赛事的比赛用数据,现在比赛早就结束了,所以自然也无法下载数据了。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。

6.3.9 深圳开放数据应用创新大赛

  • 网址:已失效

  深圳开放数据应用创新大赛提供了多种类型的开放数据。其中,出租车数据为深圳市2019年10月8日至2019年10月14日出租车、公交车、重型货车、普通货车以及各种特种营运车辆GPS数据。

  不过需要注意,这个数据目前也找不到了——这个同样是当初一个数据分析赛事的比赛用数据,现在比赛早就结束了,所以自然也无法下载数据了。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。

6.4 手机信令数据

6.4.1 Urban Data Release

  Urban Data Release是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的城市数据集,包括深圳市手机CDR数据、智能卡数据与出租车、公交车轨迹数据。如下图所示。

  至此,大功告成。

欢迎关注:疯狂学习GIS

数据分析必备:GPS轨迹、软件签到、手机信令数据获取方式合集的更多相关文章

  1. Python数据分析必备Anaconda安装、快捷键、包安装

    Python数据分析必备: 1.Anaconda操作 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便 ...

  2. 基于PostGIS使用GeoServer发布数据量大的GPS轨迹路线图

    1. 引言 人类在行走或者驾驶过程中产生的GPS轨迹,是道路的一种采样,根据GPS轨迹路线,我们可以推知道路的存在,根据轨迹的密度,可以推知道路的热度以及重要性.如何才能在地图中显示大量的轨迹,这是一 ...

  3. arcgis android 图上记录gps轨迹

    原文  arcgis android 图上记录gps轨迹 public class MainActivity extends Activity { MapView mMapView; Location ...

  4. GPS/轨迹追踪、轨迹回放、围栏控制

    折腾一个多月终于弄完了这个项目,起初都未曾接触GPS/轨迹追踪.轨迹回放.圈划围栏...等一些在百度地图或者Googel地图操作的一些业务,后端的业务相对来说简单点 cas单点登录,mongdb灵活的 ...

  5. 转载请注明:Windows 系统必备好用软件&工具合集跟推荐 | 老D博客

    Windows 系统必备好用软件&工具合集跟推荐 97 63,371 A+ 所属分类:工具软件 一.浏览器 二.下载软件 三.播放软件 五.电子邮件客户端 六.图片/照片 浏览查看工具 七.文 ...

  6. Remote Desktop安卓软件实现手机远程控制电脑

    这篇文章写的是利用Remote Desktop安卓软件实现手机远程控制电脑. 电脑上的操作: 鼠标右击计算机>属性>远程设置>计算机名 如下图:

  7. GPS轨迹发生模拟器介绍

    GPS轨迹发生模拟器介绍 GPS信号模拟器能够模拟卫星信号运动轨迹,模拟GPS卫星导航系统的导航信号.GPS轨迹发生器可以模拟导航系统确定位置点如日期.时间.经度.纬度.海拔信息.速度等.GPS轨迹模 ...

  8. Spark高级数据分析——纽约出租车轨迹的空间和时间数据分析

    Spark高级数据分析--纽约出租车轨迹的空间和时间数据分析 一.地理空间分析: 二.pom.xml 原文地址:https://www.jianshu.com/p/eb6f3e0c09b5 作者:II ...

  9. 【开发必备】2018最新中国国内可用API合集

    中国国内可用API合集 笔记 OneNote - OneNote支持获取,复制,创建,更新,导入与导出笔记,支持为笔记添加多媒体内容,管理权限等.提供SDK和Demo. 为知笔记 - 为知笔记Wind ...

  10. 【转】Ubuntu常用软件合集

    [转]Ubuntu常用软件合集 Ubuntu常用软件合集 我用的使Ubuntu-Kylin14.04,原因呢主要是觉得使本土化的,自带了日历.输入法.优客助手等易于上手的应用.也省的每次安装完原生的系 ...

随机推荐

  1. javascript 陀螺仪加摄像头可以玩出AR效果

    原文链接:https://blog.jijian.link/2020-09-08/js-ar/ 重要事情说三遍 此文章中的API接口,必须放在 https 协议下测试!浏览器APP必须开启摄像头权限! ...

  2. 搭建自己的OCR服务,第二步:PaddleOCR环境安装

    PaddleOCR环境安装,遇到了很多问题,根据系统不同问题也不同,不要盲目看别人的教程,有的教程也过时了,根据实际情况自己调整. 我这边目前是使用windows 10系统+CPU + python ...

  3. 2D小游戏--猜对应卡牌(unity)

    博客地址:https://www.cnblogs.com/zylyehuo/ 项目名称 guess_card_game 参考源码链接: https://www.manning.com/books/un ...

  4. Proxmox VE安装CentOS 8.3

    相信玩服务器/VPS的对CentOS一定不陌生,CentOS 是一个基于Red Hat Linux 提供的可自由使用源代码的企业级Linux发行版本.因为是免费的,现在很多WEB服务器和VPS都经常使 ...

  5. 分布式一致性算法-Paxos、Raft、ZAB、Gossip

      为什么需要一致性 数据不能存在单个节点(主机)上,否则可能出现单点故障. 多个节点(主机)需要保证具有相同的数据. 一致性算法就是为了解决上面两个问题. 一致性算法的定义 一致性就是数据保持一致, ...

  6. oracle调整sga、pga大小

    展开修改sga大小1-1查看当前sga大小SQL> show parameter sga1-2修改sga_max_size为24GSQL> alter system set sga_max ...

  7. 2025年3月GESP八级真题解析

    第一题--上学 题目描述 C 城可以视为由 \(n\) 个结点与 \(m\) 条边组成的无向图.这些结点依次以 \(1,2,-,n\) 标号,边依次以 \(1,2,-,m\) 标号.第 \(i\) 条 ...

  8. Linux脚本-自动ping网址列表

    背景 公司某一项业务需要管理多种类硬件,有一些硬件的管理功能没有实现前台展示,检测和硬件之间的网络连接状况需要通过ping每个ip地址来单独实现.在需要大规模调试网络的时候,每个硬件单独ping就显得 ...

  9. 【uniapp】文本控件多余文字省略号代替

    多余文字使用省略号效果 代码 .l-dd-content{ width: 100%; color: #8b8b8b; display: -webkit-box; /** 对象作为伸缩盒子模型显示 ** ...

  10. Linux学习笔记(三)----进程

    简介 进程是系统资源分配的最小单位,它曾经也是CPU调度的最小单位,但后面被线程所取代. 进程树 Linux系统通过父子进程关系串联起来,所有进程之前构成了一个多叉树结构. 孤儿进程 孤儿进程是指父进 ...