【Python爬虫】第四课（查询照片拍摄地址）

首先，要能够查询到照片地址，查询的照片必须要开GPS拍，且上传时用原图……

查询图片的exif信息，使用exifread包

import exifread

img = exifread.process_file(open(path), 'rb')

longitude = img['GPS GPSLongitude']

latitude = img['GPS GPSLatitude']

这里建议，可以找一个exif查看器上传一个图片看一看，对GPS GPSLongitude等信息有一个直观印象

到这里，我花费时间最长才发现的一个坑。现象是我写完后，读取结果总是[]，print(resp.text)发现经纬度根本没有读进去。type(longitude)才发现这是<class 'exifread.classes.IfdTag'>对象。这才明白，我根本没有获取到值得原因。以后的教训是：对一个未用过的工具，可以一步步看下输出的结果是什么。

longitude_gps = longitude.values

latitude_gps = latitude.values

下一步，我一开始也不清楚，拿到的是度分秒的经纬度，需要转化为十进制的经纬度

转换公式为度+分/60+秒/3600,得到longitude_new, latitude_news

吸取上一步教训，longitude_gps[0],longitude_gps[1],longitude_gps[2] 分别为度，分，秒，但要用.num方法获取值

按道理，我们已经将度分秒的经纬度进行了转换，用于最后一步。

import requests

import json

url = 'https://restapi.amap.com/v3/geocode/regeo?key={}&location={}' #详见高德逆解析地理API文档

location = '{},{}'.format(longitude_new, latitude_news)

api_key = 'sdasadsadsad' #申请成为高德个人开发者。添加应用管理既可

resp = requests.get(url.format(api_key, location))

data = json.loads(resp.text)

address = data.get('regeocode').get('formatted_address')

print(address)

再回头看以上，还有两个问题是在实际测试中发现的。

1. 经纬度，高德提供小数点后6位，因此要约一下，用round函数即可

2. longitude_gps[2] 在整数的时候没问题，但会遇到m/n的情况，这无法直接运算，会出现较大误差。更改为eval(str(latitude_gps[-1]))计算。

【Python爬虫】第四课（查询照片拍摄地址）的更多相关文章

Python爬虫实战四之抓取淘宝MM照片
原文:Python爬虫实战四之抓取淘宝MM照片其实还有好多,大家可以看 Python爬虫学习系列教程福利啊福利,本次为大家带来的项目是抓取淘宝MM照片并保存起来,大家有没有很激动呢? 本篇目标 1. ...
Python爬虫进阶四之PySpider的用法
审时度势 PySpider 是一个我个人认为非常方便并且功能强大的爬虫框架,支持多线程爬取.JS动态解析,提供了可操作界面.出错重试.定时爬取等等的功能,使用非常人性化. 本篇内容通过跟我做一个好玩的 ...
Python爬虫入门四之Urllib库的高级用法
1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览 ...
转 Python爬虫入门四之Urllib库的高级用法
静觅 » Python爬虫入门四之Urllib库的高级用法 1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我 ...
Python爬虫之爬取淘女郎照片示例详解
这篇文章主要介绍了Python爬虫之爬取淘女郎照片示例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧本篇目标抓取淘宝MM ...
Python爬虫教程-11-proxy代理IP，隐藏地址（猫眼电影）
Python爬虫教程-11-proxy代理IP,隐藏地址(猫眼电影) ProxyHandler处理(代理服务器),使用代理IP,是爬虫的常用手段,通常使用UserAgent 伪装浏览器爬取仍然可能被网 ...
手把手教你写电商爬虫-第四课淘宝网商品爬虫自动JS渲染
版权声明:本文为博主原创文章,未经博主允许不得转载. 系列教程: 手把手教你写电商爬虫-第一课找个软柿子捏捏手把手教你写电商爬虫-第二课实战尚妆网分页商品采集爬虫手把手教你写电商爬虫-第三课 ...
python爬虫入门四：BeautifulSoup库(转)
正则表达式可以从html代码中提取我们想要的数据信息,它比较繁琐复杂,编写的时候效率不高,但我们又最好是能够学会使用正则表达式. 我在网络上发现了一篇关于写得很好的教程,如果需要使用正则表达式的话,参 ...
python爬虫入门之快递查询
现在快递遍布生活的角角落落,一个快递其实是信息的集合体,里面包含大量的物流信息,那能不能自己实现一个快递查询的小功能?答案是能的!现在也有别人整理好的快递查询api,比如说快递100,可以通过它提供的 ...

随机推荐

纯数据结构Java实现(6/11)(二叉堆&优先队列)
堆其实也是树结构(或者说基于树结构),一般可以用堆实现优先队列. 二叉堆堆可以用于实现其他高层数据结构,比如优先队列而要实现一个堆,可以借助二叉树,其实现称为: 二叉堆 (使用二叉树表示的堆). ...
**p，*p和&p使用有感
*p两种使用情况: 1.定义指针变量,如char *p:这里p是一个变量,单单在这一点上与int a 无差别:但p这个变量特殊在其中只能存地址. 引申:对于char **p,p中存一个地址add1,a ...
Yarn上常驻Spark-Streaming程序调优
对于长时间运行的Spark Streaming作业,一旦提交到YARN群集便需要永久运行,直到有意停止.任何中断都会引起严重的处理延迟,并可能导致数据丢失或重复.YARN和Apache Spark都不 ...
Requests+正则表达式爬取猫眼电影(TOP100榜)
猫眼电影网址:www.maoyan.com 前言:网上一些大神已经对猫眼电影进行过爬取,所用的方法也是各有其优,最终目的是把影片排名.图片.名称.主要演员.上映时间与评分提取出来并保存到文件或者数据库 ...
Nacos（八）：Nacos持久化
参考和感谢 Spring Cloud Alibaba基础教程:Nacos的数据持久化前言前景回顾: Nacos(七):Nacos共享配置 Nacos(六):多环境下如何"管理" ...
MSIL实用指南-位运算
C#支持的位运算是与.或.异或.取反.左移.右移,它们对应的指令是And.Or.Xor.Not.Shl.Shr. 取反运算只需要一个操作数,生成步骤是1.生成加载变量2.生成取反指令实例代码: ilG ...
GC回收算法&&GC回收器
GC回收算法什么是垃圾? 类比日常生活中,如果一个东西经常没被使用,那么就可以说是垃圾. 同理,如果一个对象不可能再被引用,那么这个对象就是垃圾,应该被回收. 垃圾:不可能再被引用的对象. fina ...
codeblocks中文乱码原因及解决办法
原因:(本地化做得不够好)默认情况下codeblocks编辑器保存源文件是保存为windows本地编码,就是WINDOWS-936字符集,即GBK:但CB的编辑器在默认编辑的时候是按照UTF-8来解析 ...
可以穿梭时空的实时计算框架——Flink对时间的处理
Flink对于流处理架构的意义十分重要,Kafka让消息具有了持久化的能力,而处理数据,甚至穿越时间的能力都要靠Flink来完成. 在Streaming-大数据的未来一文中我们知道,对于流式处理最重要 ...
【管理学】PDCA

【Python爬虫】第四课（查询照片拍摄地址）

【Python爬虫】第四课（查询照片拍摄地址）的更多相关文章

随机推荐

热门专题