title: xpath提取多个标签下的text author: 青南 date: 2015-01-17 16:01:07 categories: [Python] tags: [xpath,Python,xml,scrapy] --- 本文首发在http://kingname.info 在写爬虫的时候,经常会使用xpath进行数据的提取,对于如下的代码: <div id="test1">大家好!</div> 使用xpath提取是非常方便的.假设网页的源代码在s…
前段时间我遇到一个问题,就是说普通的平台获取cookie的语句为↓           Default <script src=js地址></script> 1 <script src=js地址></script> 实际上我们的测试语句可能为↓           Default <script>alert("90sec")</script> 1 <script>alert("90sec&qu…
遍历目录下所有文件的最后一行进行判断若错误及时邮件报警-案例: #-*- encoding: utf-8 -*- __author__ = 'liudong' import linecache,sys,time,datetime,os import urllib,sys,urllib,json,smtplib from email.mime.text import MIMEText mailto_list=['liudong@philisense.com'] mail_host="smtp.ph…
IE6 P标签下的DIV标签无法inline-block,使其触发了hasLayout属性再用csshack 使其inline还是不行,始终要换行 解决:把div标签替换成非div标签,比如span等.…
以前有对xsd(也就是schema文件)小做研究,有个小困惑,就是我们定义的元素只能使用定义的哪一些标签,比如<beans>下面就只能有自定义的哪一些,那为什么在引入<context>.<aop>等命名空间之后就能使用上诉2个标签呢?之前一直嫌弃spring的xsd太长,第一眼看上去比较混乱,今天鼓起勇气看了一下<beans>的xsd文件,看了之后发现其实还是非常简单的,所使用的无外乎也就是xsd那些东西. 那么,<beans>标签下对元素的定义…
这里简单整理下灵动标签下的常用标签 标题名称:<?=$bqr['title']?>  <?=esub($bqr[title],22)?> 限制字符22个 标题链接:<?=$bqsr['titleurl']?> 副标题:<?=esub($bqr[ftitle],20)?> 标题图片: <?=$bqr['titlepic']?> 内容简介: <?=$bqr['smalltext']?>   <?=esub($bqr[smalltex…
前端基础HTML标签(下) 1.表单 表单的功能主要用于向服务器传输数据,从而实现客户端与Web服务器的交互.表单能够包含input系列标签,比如:文本字段.复选框.单选按钮.提交按钮等:表单还包含textarea.select和label标签: 表单的属性:action,将表单数据提交到指定服务器的某个程序,程序收到表单提交过来的数据(即表单数据)做相应处理,比如:https://baidu.com:method,表单的提交方式get/post/update等,默认为get: 注意 from表…
::-exec-] org.apache.coyote.http11.Http11Processor.service Error processing request java.lang.NullPointerException at org.apache.tomcat.util.buf.CharChunk.append(CharChunk.java:) at org.apache.catalina.mapper.Mapper.map(Mapper.java:) at org.apache.ca…
cnpm 莫名奇妙bug 莫名奇妙的痛 最近想搭建react@v16 和 react-router@v4,搭建过程打算用vue脚手架webpack模板那套配置方法(webpack3). 由于我之前安装的是webpack4,和高版本的webpack-dev-server,Vue那个是webpack3.然后我就直接cnpm i webpack@3.6.0 webpack-dev-server@2.9.1 -D,本想着替换版本,然后运行也可以. 但是在我已经搭建好react babel esclint…
/text()获取指定标签下的文本内容,//text()获取指定标签下的文本内容,包括子标签下的文本内容,比较简单的是利用字符串相加: room_infos = li.xpath('.//a[@class="resblock-room"]/span//text()').extract() room_info = '' for i in room_infos: room_info = room_info + i.strip(' ')…