数据分析必备:GPS轨迹、软件签到、手机信令数据获取方式合集
本文对目前主要的出租车、公交车、行人GPS轨迹、社交软件签到、手机信令等数据产品的获取网站加以整理与介绍。
本文为“GIS数据获取整理”专栏中第六篇独立博客,因此本文全部标题均由6开头。本文对目前主要的个人GPS轨迹、出租车与公交车GPS轨迹、个人签到与手机信令数据下载网站加以整理与介绍。
6 GPS轨迹与签到数据
6.1 个人GPS轨迹数据
6.1.1 GeoLife GPS Trajectories
GeoLife GPS Trajectories是微软亚洲研究院(Microsoft Research Asia)Geolife项目生产的182位用户于2007年04月至2012年08月期间的轨迹数据,记录了用户多种户外活动过程中所发生的移动信息。如下图所示。

6.1.2 GPS Trajectories with transportation mode labels
GPS Trajectories with transportation mode labels同样是微软亚洲研究院(Microsoft Research Asia)Geolife项目生产的数据。而与前者不同的是,本数据中每一个GPS轨迹数据都对应着一个运动类型标签,即都代表对应用户的一种户外行动记录。如下图所示。

6.2 个人签到数据
6.2.1 Gowalla
Gowalla是斯坦福大学生产的2009年02月至2010年10月期间用户社交媒体软件的签到数据,共有6,442,890条数据。如下图所示。

6.2.2 Gowalla Dataset
- 网址:已失效
Gowalla Dataset是在Gowalla基础之上进一步丰富的用户签到数据集。其新增了2010年11月至2010年12月期间用户Facebook签到数据。数据共包含319,063位用户的36,001,959条签到数据。
不过需要注意,这个Gowalla Dataset目前找不到了——只要访问原网址,会被重定向到一个国外玩扑克的网站,也就是数据网址失效了。当初我第一次写这篇博客的时候肯定还是能打开的,要不然我也不会放进来,但是现在不行了。从这个数据集的原网址域名上看,估计这个数据集是一位名叫yongliu的学者收集或分发的,并用自己的域名分享出来了;但估计是学术太繁忙,其也顾不上维护自己的网站了,所以目前进不去数据地址了。但是这个数据先暂且留着,后面如果又找到了我再更新。
6.3 出租车、公交车GPS轨迹数据
6.3.1 T-Drive
T-Drive 轨迹数据样本(Trajectory Data Sample)来源于微软,具有北京市2008年02月02日至02月08日共一周时间内10357辆出租车的轨迹数据。其具有约1.5千万个数据点,总行驶里程约900万千米。如下图所示。

6.3.2 The epfl/mobility dataset
The epfl/mobility dataset包含美国旧金山湾区2008年05月17日至2008年06月10日大约500辆出租车的GPS轨迹数据。如下图所示。

6.3.3 Smart City Research Group
- 网址:已失效
Smart City Research Group是香港科技大学生产的城市轨迹数据,包括出租车、公交车、手机社交网络数据等。其中,出租车数据为上海市2007年02月20日单日数据,公交车数据为2007年02月23日数据。
不过需要注意,这个数据目前也找不到了——只要访问原网址,会被显示无访问权限,也就是数据网址同样失效了。同样从原本的域名分析,这个数据原本应该是课题组通过港科大的Computer Science and Engineering学院官网发布的;现在访问不了的话,估计是课题组取消了数据的公开分享。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。
6.3.4 The roma/taxi dataset
The roma/taxi dataset包含罗马2014年02月01日至2014年03月02日大约320辆出租车的GPS轨迹数据。如下图所示。

6.3.5 Urban Data Release
Urban Data Release是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的城市数据集,包括深圳市手机CDR数据、智能卡数据与出租车、公交车轨迹数据。如下图所示。

6.3.6 Electric Vehicle Data
Electric Vehicle Data是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的电动出租车数据集,包括深圳市单日664辆出租车的1,155,654条GPS数据。如下图所示。

6.3.7 中华人民共和国交通运输部交通智数
中华人民共和国交通运输部交通智数是中华人民共和国交通运输部下属交通数据分享平台,具有全国多个城市的出租车GPS轨迹数据。如下图所示。

6.3.8 交通线路通达时间预测
- 网址:已失效
交通线路通达时间预测是成都一家数据公司主办的数据分析赛事,其提供了成都市2014年08月03日至2014年08月30日1.4万余辆出租车14亿+条GPS记录。报名参赛后即可下载对应数据。
不过需要注意,这个数据目前也找不到了——这个是当初一个数据分析赛事的比赛用数据,现在比赛早就结束了,所以自然也无法下载数据了。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。
6.3.9 深圳开放数据应用创新大赛
- 网址:已失效
深圳开放数据应用创新大赛提供了多种类型的开放数据。其中,出租车数据为深圳市2019年10月8日至2019年10月14日出租车、公交车、重型货车、普通货车以及各种特种营运车辆GPS数据。
不过需要注意,这个数据目前也找不到了——这个同样是当初一个数据分析赛事的比赛用数据,现在比赛早就结束了,所以自然也无法下载数据了。不过还是老规矩,这条数据记录先不删除,后面如果又能下载的话我再更新。
6.4 手机信令数据
6.4.1 Urban Data Release
Urban Data Release是新泽西州立罗格斯大学助理教授Desheng Zhang课题组生产的城市数据集,包括深圳市手机CDR数据、智能卡数据与出租车、公交车轨迹数据。如下图所示。

至此,大功告成。
欢迎关注:疯狂学习GIS
数据分析必备:GPS轨迹、软件签到、手机信令数据获取方式合集的更多相关文章
- Python数据分析必备Anaconda安装、快捷键、包安装
Python数据分析必备: 1.Anaconda操作 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便 ...
- 基于PostGIS使用GeoServer发布数据量大的GPS轨迹路线图
1. 引言 人类在行走或者驾驶过程中产生的GPS轨迹,是道路的一种采样,根据GPS轨迹路线,我们可以推知道路的存在,根据轨迹的密度,可以推知道路的热度以及重要性.如何才能在地图中显示大量的轨迹,这是一 ...
- arcgis android 图上记录gps轨迹
原文 arcgis android 图上记录gps轨迹 public class MainActivity extends Activity { MapView mMapView; Location ...
- GPS/轨迹追踪、轨迹回放、围栏控制
折腾一个多月终于弄完了这个项目,起初都未曾接触GPS/轨迹追踪.轨迹回放.圈划围栏...等一些在百度地图或者Googel地图操作的一些业务,后端的业务相对来说简单点 cas单点登录,mongdb灵活的 ...
- 转载请注明:Windows 系统必备好用软件&工具合集跟推荐 | 老D博客
Windows 系统必备好用软件&工具合集跟推荐 97 63,371 A+ 所属分类:工具软件 一.浏览器 二.下载软件 三.播放软件 五.电子邮件客户端 六.图片/照片 浏览查看工具 七.文 ...
- Remote Desktop安卓软件实现手机远程控制电脑
这篇文章写的是利用Remote Desktop安卓软件实现手机远程控制电脑. 电脑上的操作: 鼠标右击计算机>属性>远程设置>计算机名 如下图:
- GPS轨迹发生模拟器介绍
GPS轨迹发生模拟器介绍 GPS信号模拟器能够模拟卫星信号运动轨迹,模拟GPS卫星导航系统的导航信号.GPS轨迹发生器可以模拟导航系统确定位置点如日期.时间.经度.纬度.海拔信息.速度等.GPS轨迹模 ...
- Spark高级数据分析——纽约出租车轨迹的空间和时间数据分析
Spark高级数据分析--纽约出租车轨迹的空间和时间数据分析 一.地理空间分析: 二.pom.xml 原文地址:https://www.jianshu.com/p/eb6f3e0c09b5 作者:II ...
- 【开发必备】2018最新中国国内可用API合集
中国国内可用API合集 笔记 OneNote - OneNote支持获取,复制,创建,更新,导入与导出笔记,支持为笔记添加多媒体内容,管理权限等.提供SDK和Demo. 为知笔记 - 为知笔记Wind ...
- 【转】Ubuntu常用软件合集
[转]Ubuntu常用软件合集 Ubuntu常用软件合集 我用的使Ubuntu-Kylin14.04,原因呢主要是觉得使本土化的,自带了日历.输入法.优客助手等易于上手的应用.也省的每次安装完原生的系 ...
随机推荐
- [Qt 基础-03] QRadioButton
QRadioButton基础 本文主要根据QT官方帮助文档以及日常使用,简单的介绍一下QRadioButton的功能以及使用 文章目录 QRadioButton基础 简介 autoExclusive ...
- docker配置Nvidia环境,使用GPU
前言 需要 nvdia driver 安装好,请参考 Ubuntu Nvidia driver驱动安装及卸载 docker 安装 配置 apt 阿里云的镜像源 sudo curl -fsSL http ...
- golang定时器函数 每隔几分钟执行一个函数
延时调用 AfterFunc go function() func function() { // TODO 具体逻辑 // 每5分钟执行一次,递归调用自己 time.AfterFunc(5*time ...
- mysql8导入myslq5 报错
打开sql文件替换 我的数据库编码是utf8mb4,如果你的数据库编码是别的,替换成你自己的编码. utf8mb4_0900_ai_ci替换为utf8mb4_general_ci
- 人工智能-A*算法-最优路径搜索实验
上次学会了<A*算法-八数码问题>,初步了解了A*算法的原理,本次再用A*算法完成一个最优路径搜索实验. 一.实验内容1. 设计自己的启发式函数.2. 在网格地图中,设计部分障碍物.3. ...
- osmts:OERV之一站式管理测试脚本
最近团队里面实习的小伙伴开发了一个新的项目,可以用来一键式运行各种测试脚本并且完成数据总结,我也尝试部署了一下,遇到了一些问题,接下来一起解析一下这个项目. 首先是获取osmts git cl ...
- [每日算法] leetcode第2题:两数相加
leetcode第2题入口 题目描述 给你两个 非空 的链表,表示两个非负的整数.它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字. 请你将两个数相加,并以相同形式返回一个表 ...
- 深入掌握FastAPI与OpenAPI规范的高级适配技巧
title: 深入掌握FastAPI与OpenAPI规范的高级适配技巧 date: 2025/03/30 01:16:11 updated: 2025/03/30 01:16:11 author: c ...
- Jmeter参数化总结
参数化步骤: 1.连接数据库 2.获取account表手机号数据 3.获取手机号个数 4.增加For Each控制器 5.将请求添加至循环控制器里面 脚本:循环登录.jmx 页面如下: 下面主要说明F ...
- 🎀MySQL-关键字执行顺序
简介 在MySQL中,SQL查询语句的执行遵循一定的逻辑顺序,即使这些关键字在SQL语句中的物理排列可能有所不同. 语句顺序 (8) SELECT (9) DISTINCT<select_lis ...