数据分析必备:GPS轨迹、软件签到、手机信令数据获取方式合集
本文对目前主要的出租车、公交车、行人GPS轨迹、社交软件签到、手机信令等数据产品的获取网站加以整理与介绍。
本文为“GIS数据获取整理”专栏中第六篇独立博客,因此本文全部标题均由6开头。本文对目前主要的个人GPS轨迹、出租车与公交车GPS轨迹、个人签到与手机信令数据下载网站加以整理与介绍。
6 GPS轨迹与签到数据
6.1 个人GPS轨迹数据
6.1.1 GeoLife GPS Trajectories
GeoLife GPS Trajectories是微软亚洲研究院(Microsoft Research Asia)Geolife项目生产的182位用户于2007年04月至2012年08月期间的轨迹数据,记录了用户多种户外活动过程中所发生的移动信息。如下图所示。

6.1.2 GPS Trajectories with transportation mode labels
GPS Trajectories with transportation mode labels同样是微软亚洲研究院(Microsoft Research Asia)Geolife项目生产的数据。而与前者不同的是,本数据中每一个GPS轨迹数据都对应着一个运动类型标签,即都代表对应用户的一种户外行动记录。如下图所示。

6.2 个人签到数据
6.2.1 Gowalla
Gowalla是斯坦福大学生产的2009年02月至2010年10月期间用户社交媒体软件的签到数据,共有6,442,890条数据。如下图所示。

6.2.2 Gowalla Dataset
- 网址:已失效
Gowalla Dataset是在Gowalla基础之上进一步丰富的用户签到数据集。其新增了2010年11月至2010年12月期间用户Facebook签到数据。数据共包含319,063位用户的36,001,959条签到数据。
不过需要注意,这个Gowalla Dataset目前找不到了——只要访问原网址,会被重定向到一个国外玩扑克的网站,也就是数据网址失效了。当初我第一次写这篇博客的时候肯定还是能打开的,要不然我也不会放进来,但是现在不行了。从这个数据集的原网址域名上看,估计这个数据集是一位名叫yongliu的学者收集或分发的,并用自己的域名分享出来了;但估计是学术太繁忙,其也顾不上维护自己的网站了,所以目前进不去数据地址了。但是这个数据先暂且留着,后面如果又找到了我再更新。
6.3 出租车、公交车GPS轨迹数据
6.3.1 T-Drive
T-Drive 轨迹数据样本(Trajectory Data Sample)来源于微软,具有北京市2008年02月02日至02月08日共一周时间内10357辆出租车的轨迹数据。其具有约1.5千万个数据点,总行驶里程约900万千米。如下图所示。

6.3.2 The epfl/mobility dataset
The epfl/mobility dataset包含美国旧金山湾区2008年05月17日至2008年06月10日大约500辆出租车的GPS轨迹数据。如下图所示。

6.3.3 Smart City Research Group
- 网址:已失效
Smart City Research Group是香港科技大学生产的城市轨迹数据,包括出租车、公交车、手机社交网络数据等。其中,出租车数据为上海市2007年02月20日单日数据,公交车数据为2007年02月23日数据。
不过需要注意,这个数据目前也找不到了——只要访问原网址,会被显示无访问权限,也就是数据网址同样失效了。同样从原本的域名分析,这个数据原本应该是课题组通过港科大的Computer Science and Engineering学院官网发布的;现在访问不了的话,估计是课题组取消了数据的公开分享。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。
6.3.4 The roma/taxi dataset
The roma/taxi dataset包含罗马2014年02月01日至2014年03月02日大约320辆出租车的GPS轨迹数据。如下图所示。

6.3.5 Urban Data Release
Urban Data Release是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的城市数据集,包括深圳市手机CDR数据、智能卡数据与出租车、公交车轨迹数据。如下图所示。

6.3.6 Electric Vehicle Data
Electric Vehicle Data是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的电动出租车数据集,包括深圳市单日664辆出租车的1,155,654条GPS数据。如下图所示。

6.3.7 中华人民共和国交通运输部交通智数
中华人民共和国交通运输部交通智数是中华人民共和国交通运输部下属交通数据分享平台,具有全国多个城市的出租车GPS轨迹数据。如下图所示。

6.3.8 交通线路通达时间预测
- 网址:已失效
交通线路通达时间预测是成都一家数据公司主办的数据分析赛事,其提供了成都市2014年08月03日至2014年08月30日1.4万余辆出租车14亿+条GPS记录。报名参赛后即可下载对应数据。
不过需要注意,这个数据目前也找不到了——这个是当初一个数据分析赛事的比赛用数据,现在比赛早就结束了,所以自然也无法下载数据了。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。
6.3.9 深圳开放数据应用创新大赛
- 网址:已失效
深圳开放数据应用创新大赛提供了多种类型的开放数据。其中,出租车数据为深圳市2019年10月8日至2019年10月14日出租车、公交车、重型货车、普通货车以及各种特种营运车辆GPS数据。
不过需要注意,这个数据目前也找不到了——这个同样是当初一个数据分析赛事的比赛用数据,现在比赛早就结束了,所以自然也无法下载数据了。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。
6.4 手机信令数据
6.4.1 Urban Data Release
Urban Data Release是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的城市数据集,包括深圳市手机CDR数据、智能卡数据与出租车、公交车轨迹数据。如下图所示。

至此,大功告成。
欢迎关注:疯狂学习GIS
数据分析必备:GPS轨迹、软件签到、手机信令数据获取方式合集的更多相关文章
- Python数据分析必备Anaconda安装、快捷键、包安装
Python数据分析必备: 1.Anaconda操作 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便 ...
- 基于PostGIS使用GeoServer发布数据量大的GPS轨迹路线图
1. 引言 人类在行走或者驾驶过程中产生的GPS轨迹,是道路的一种采样,根据GPS轨迹路线,我们可以推知道路的存在,根据轨迹的密度,可以推知道路的热度以及重要性.如何才能在地图中显示大量的轨迹,这是一 ...
- arcgis android 图上记录gps轨迹
原文 arcgis android 图上记录gps轨迹 public class MainActivity extends Activity { MapView mMapView; Location ...
- GPS/轨迹追踪、轨迹回放、围栏控制
折腾一个多月终于弄完了这个项目,起初都未曾接触GPS/轨迹追踪.轨迹回放.圈划围栏...等一些在百度地图或者Googel地图操作的一些业务,后端的业务相对来说简单点 cas单点登录,mongdb灵活的 ...
- 转载请注明:Windows 系统必备好用软件&工具合集跟推荐 | 老D博客
Windows 系统必备好用软件&工具合集跟推荐 97 63,371 A+ 所属分类:工具软件 一.浏览器 二.下载软件 三.播放软件 五.电子邮件客户端 六.图片/照片 浏览查看工具 七.文 ...
- Remote Desktop安卓软件实现手机远程控制电脑
这篇文章写的是利用Remote Desktop安卓软件实现手机远程控制电脑. 电脑上的操作: 鼠标右击计算机>属性>远程设置>计算机名 如下图:
- GPS轨迹发生模拟器介绍
GPS轨迹发生模拟器介绍 GPS信号模拟器能够模拟卫星信号运动轨迹,模拟GPS卫星导航系统的导航信号.GPS轨迹发生器可以模拟导航系统确定位置点如日期.时间.经度.纬度.海拔信息.速度等.GPS轨迹模 ...
- Spark高级数据分析——纽约出租车轨迹的空间和时间数据分析
Spark高级数据分析--纽约出租车轨迹的空间和时间数据分析 一.地理空间分析: 二.pom.xml 原文地址:https://www.jianshu.com/p/eb6f3e0c09b5 作者:II ...
- 【开发必备】2018最新中国国内可用API合集
中国国内可用API合集 笔记 OneNote - OneNote支持获取,复制,创建,更新,导入与导出笔记,支持为笔记添加多媒体内容,管理权限等.提供SDK和Demo. 为知笔记 - 为知笔记Wind ...
- 【转】Ubuntu常用软件合集
[转]Ubuntu常用软件合集 Ubuntu常用软件合集 我用的使Ubuntu-Kylin14.04,原因呢主要是觉得使本土化的,自带了日历.输入法.优客助手等易于上手的应用.也省的每次安装完原生的系 ...
随机推荐
- golang interface 转 string、int、float64
interface{} interface{} 接口.interface{} 类型很多人都会混淆.interface{} 类型是没有方法的接口.由于没有 implements 关键字,所以说所有的类型 ...
- NumPy学习8
今天学习了NumPy统计函数 16,NumPy统计函数 numpy_test8.py : import numpy as np ''' 16,NumPy统计函数 NumPy 提供了许多统计功能的函数, ...
- SpringBoot+使用过滤器链执行风控决策
风控流程 下单前进行风控校验 // 1.begin---风控处理---前置处理{黑白名单校验} RiskControlRuleEnum controlRuleEnum = riskControlHan ...
- 搭建docker swarm集群实现负载均衡
Swarm简介:Swarm是Docker官方提供的一款集群管理工具,其主要作用是把若干台Docker主机抽象为一个整体,并且通过一个入口统一管理这些Docker主机上的各种Docker资源.Swarm ...
- Linux上安装配置InstantClient及64位系统Pl/SQL配置
1.首先到官网下载文件:http://www.oracle.com/technetwork/database/features/instant-client/index-097480.html?ssS ...
- Go初入武林之乘法表
为统一管理源码, 请到gitee中查看. GoTimesTable
- .NET 原生驾驭 AI 新基建实战系列(二):Semantic Kernel 整合对向量数据库的统一支持
1. 引言 在人工智能(AI)应用开发迅猛发展的今天,向量数据库作为存储和检索高维数据的重要工具,已经成为许多场景(如自然语言处理.推荐系统和语义搜索)的核心组件. 对于.NET生态系统的开发者而言, ...
- shell处理字符串
概念 字符串是shell编程中最常用最有用的数据类型(除了数字和字符串,也没啥其它类型好用了),字符串可以用单引号,也可以用双引号,也可以不用引号. 单引号声明字符串 单引号里的任何字符都会原样输出, ...
- PC端自动化测试实战教程-2-pywinauto 启动PC端应用程序 - 上篇(详细教程)
1.简介 经过上一篇的学习.介绍和了解,想必小伙伴或者童鞋们,已经见识到pywinauto的强大了,今天继续介绍pywinauto,上一篇已经可以打开计算器了,这里宏哥在提供其他方法进行打开计算器和非 ...
- fiddler抓包常用辅助工具
一.过滤器 1.hosts: 只展示内网或外网的hosts,internet(外网),Intranet(内网) 展示下面的hosts/隐藏下面的hosts/:选择后填写需要设置的hosts(地址前面的 ...