回顾爬虫的时候的一些小TIPS
1
json.dumps的时候默认会用ascii
所以在写入文件的时候会需要用到的指令变为json.dumps(a,ensuer_ascii=False),这样将禁止转换为ascii
然后再写入的时候用f.write(b.encode())
2
xpath做解析的时候发请求头会产生问题,因为很多网站会根据不同的浏览器返回不同的DOM结构
所以很多的时候可以用一个相对老的版本的IE的user-agent
3
| xpath | / | . | / | .. | // | * | @ | [] | | | [] | N/A | () | 
| jsonpath | $ | @ | .OR[] | N/A | .. | * | N/A | [] | [,] | ?() | () | N/A | 
4
xpath helper :ctrl+shift+x
xpath善用//div[contains(@id , 'woshiqianbanbu_')]/ 模糊查询方式
5
如果不配置环境变量的时候,那么PhantomJS需要进行如下方法设置
driver = webdriver.PhantomJS(executable_path="./phantomjs") #括号中的内容就是路径,如果把phantomjs加入环境变量,那么括号内为空即可
selenium不支持phantomjs了?不清楚,反正有个警告,而且phantomjs不能自动关闭的问题还是问题
回顾爬虫的时候的一些小TIPS的更多相关文章
- HTML meta锚点跳转 小tips
		小tips meta锚点跳转 http://www.zhangxinxu.com/wordpress/2015/03/meta-http-equiv-refresh-content/ 
- Windows7驱动调试小Tips
		v:* { } o:* { } w:* { } .shape { }p.MsoNormal,li.MsoNormal,div.MsoNormal { margin: 0cm; margin-botto ... 
- 你不知道的JavaScript--Item17   循环与prototype最后的几点小tips
		1.优先使用数组而不是Object类型来表示有顺序的集合 ECMAScript标准并没有规定对JavaScript的Object类型中的属性的存储顺序. 但是在使用for..in循环对Object中的 ... 
- 小tips:JS之浅拷贝与深拷贝
		浅拷贝: function extendCopy(p) { var c = {}; for (var i in p) { c[i] = p[i]; } return c; } 深拷贝: functio ... 
- keras搭建深度学习模型的一些小tips
		定义模型两种方法: 1.sequential 类仅用于层的线性堆叠,这是目前最常用的网络架构 2.函数式API,用于层组成的有向无环图,让你可以构建任意形式的架构 from keras import ... 
- 申请MVP奖励时的小Tips
		大家新年好,今天MSPrecious为大家带来一些申请MVP奖励时的小Tips. 本文分为三个部分 MVP是什么 如何申请MVP 申请MVP需要注意的事项 MVP是什么? 我想,点进来看这篇文章的 ... 
- 整理一些《纸书科学计算器》的小Tips
		本文最开始是在2016年的文章 Win10应用<纸书科学计算器>更新啦! 发表之后撰写的,当时那篇文章收到了不少人点赞,应用在国内市场的日下载量也突然上涨,让我感到受宠若惊,这里要感谢Wp ... 
- 最近工作的一点小tips
		最近工作比较忙,但也积累了一些小tips,比较杂,不成系统,也并不很深入,就开一篇笼统的先记录一下,以后再深入挖掘. 1.-webkit-tap-highlight-color -webkit-tap ... 
- Unity3D性能优化小tips——把this.transform缓存缓存起来
		Unity3D开发时中有一个小tips,这在官方的文档里其实有提及的,但不那么显眼,这里小说一下: 在MonoBehaviour进行编程时,我们经常会用this.transform, this.gam ... 
随机推荐
- 正则表达式 (python 2)
			Python提供re模块,包含所有正则表达式的功能.由于Python的字符串本身也用\转义,所以要特别注意: s = 'ABC\\-001' # Python的字符串# 对应的正则表达式字符串变成:# ... 
- python 类属性及限制
			Student类本身需要绑定一个属性直接在class中定义属性,这种属性是类属性,归Student类所有:class Student(object): name = 'Student'类的所有实例都可 ... 
- 二、基于事件的异步编程模式(EAP)
			一.引言 在上一个专题中为大家介绍了.NET 1.0中提出来的异步编程模式--APM,虽然APM为我们实现异步编程提供了一定的支持,同时它也存在着一些明显的问题--不支持对异步操作的取消和没有提供对进 ... 
- 在一个jsp页面中引用另一个jsp文件的路径的问题
			为了提高代码的重用性,经常需要在一个jsp页面中引用另一个jsp文件的代码.关于引用时的路径的问题.下面只介绍动态引用的,我觉得静态引用的应该也一样. 相对路径: 一.在同一个文件夹下,a.jsp中引 ... 
- HDU 6206 Apple (高精确度+JAVA BigDecimal)
			Problem Description Apple is Taotao's favourite fruit. In his backyard, there are three apple trees ... 
- docker-3-常用命令(上)
			帮助命令: docker version docker info docker --help 镜像命令: docker images: 列出本地主机上的镜像 各个选项说明: ... 
- LVS的DR模式负载均衡
			参考项目:http://www.cnblogs.com/along21/p/7833261.html#auto_id_3 LVS的DR模式实现负载均衡 1.环境 lvs-server :192.168 ... 
- vue.js 组件监听
			一.在通过点击事件触发的子组件中: addCart(event) { if (!event._constructed) { return; } if (!this.food.count) { Vue. ... 
- mybatis实现最简单的增删改查
			1.数据库设计 2.项目结构(针对User不用管Blogger) User.java package com.yunqing.mybatis.bean; public class User { pri ... 
- PAT——1001	害死人不偿命的(3n+1)猜想 (15)
			对给定的任一不超过1000的正整数n,简单地数一下,需要多少步(砍几下)才能得到n=1? 输入格式:每个测试输入包含1个测试用例,即给出自然数n的值. 输出格式:输出从n计算到1需要的步数. 输入样例 ... 
