selenium 提取天猫网页数据
from time import sleep
from selenium import webdriver br = webdriver.Chrome() url = "https://www.tmall.com"
br.get(url) input = br.find_element_by_id("mq")
input.clear()
input.click()
input.send_keys("iphone")
input.submit() from lxml import etree html = etree.HTML(br.page_source) # 方式一 单独获取所有单标签后,组合 如果某个数据少了,容易错位,不推荐
# prices = html.xpath('//*[@id="J_ItemList"]/div//p[@class="productPrice"]/em/text()')
# titles = html.xpath('//*[@id="J_ItemList"]/div//p[@class="productTitle"]/a/@title')
# shops = html.xpath('//*[@id="J_ItemList"]/div//div[@class="productShop"]/a/text()')
# imgs = html.xpath('//*[@id="J_ItemList"]/div//div[@class="productImg-wrap"]//a/img/@src')
#
# list = list(zip(titles,prices,shops,imgs))
# print(list)
# print(len(list)) products = html.xpath('//div[@id="J_ItemList"]//div[@class="product-iWrap"]') for product in products:
price = product.xpath('./p[@class="productPrice"]/em/@title')
title = product.xpath('./p[@class="productTitle"]/a/@title')
shop = product.xpath('./div[@class="productShop"]/a/text()')
print(price,title,shop)
结果
C:\Users\brady\.conda\envs\python36\python.exe E:/www/djangotest/test_selenium.py
['3499.00'] ['Apple/苹果 iPhone 8'] ['\nApple Store 官方旗舰店\n']
['4999.00'] ['Apple/苹果 iPhone 8 Plus'] ['\nApple Store 官方旗舰店\n']
['5999.00'] ['Apple/苹果 iPhone 11'] ['\nApple Store 官方旗舰店\n']
['5999.00'] ['【12期免息 下单减200元】Apple/苹果 iPhone 11全网通4G 超广角拍照手机苏宁易购官方store苹果11'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['【下单立减700元】Apple/苹果 iPhone 11 Pro Max 全网通4G智能手机苏宁易购官方旗舰店苹果11ProMax'] ['\n苏宁易购官方旗舰店\n']
['5999.00'] ['【12期免息 下单减200】Apple/苹果 iPhone 11 移动联通电信4G全网通智能手机正品苏宁易购官方旗舰店苹果11'] ['\n苏宁易购官方旗舰店\n']
['9999.00'] ['【12期0息 再减500元】Apple/苹果 iPhone 11 Pro全网通4G智能手机 苏宁易购官方旗舰店 苏宁直发 苹果11pro'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['【12期0息 再减700元】Apple/苹果 iPhone 11 Pro Max 全网通4G智能手机 苏宁易购官方旗舰店苹果11Promax'] ['\n苏宁易购官方旗舰店\n']
['9999.00'] ['【下单立减500元】Apple/苹果 iPhone 11 Pro移动联通电信4G全网通手机苏宁易购官方旗舰店苹果11pro'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['Apple/苹果 iPhone 11 Pro Max'] ['\nApple Store 官方旗舰店\n']
['5088.00'] ['【下单最高减289元】Apple/苹果 iPhone XR全网通4G 双卡双待手机苏宁易购官方旗舰店 苹果iPhoneXR'] ['\n苏宁易购官方旗舰店\n']
['4388.00'] ['【下单立减189元】Apple/苹果 iPhone 8 Plus 64G 全网通4G手机 官方正品苹果iPhone8plus 苹果8p'] ['\n苏宁易购官方旗舰店\n']
['5999.00'] ['【限时享12期免息/现货速发】苹果11 Apple/iPhone 11苹果手机2019新款全网通智能手机正品xr xsmax 7plu'] ['\n中国移动手机官方旗舰店\n']
['5299.00'] ['Apple/苹果 iPhone XR'] ['\nApple Store 官方旗舰店\n']
['4449.00'] ['【限时享12期免息】Apple/苹果 iPhone 8 Plus 全网通4G智能手机iphone8plus 苹果8p 苏宁易购官方旗舰店'] ['\n苏宁易购官方旗舰店\n']
['5888.00'] ['当天发货/24期分期Apple 苹果 iPhone 11全网通苹果11正品手机X国行官方xr官网8Plus旗舰店xsmax新品11promax'] ['\n三际数码官方旗舰店\n']
['5358.00'] ['【购机送无线充电器】苹果11 中移动Apple/iPhone 11苹果手机2019新款全网通智能手机苹果xr xsmax 7plus正品'] ['\n中国移动官方旗舰店\n']
['5299.00'] ['【限时享12期免息】Apple/苹果 iPhone XR 64G/128G 全网通4G智能手机双卡双待iphonexr 苹果XR'] ['\n苏宁易购官方旗舰店\n']
['6888.00'] ['5888元起 24期分期现货苹果xsmax Apple/苹果 iPhone XS Max 官网官方旗舰店全网通11pro手机X苹果8P xr xs 7'] ['\n三际数码官方旗舰店\n']
['9999.00'] ['Apple/苹果 iPhone 11 Pro'] ['\nApple Store 官方旗舰店\n']
['5349.00'] ['【顺丰发货 下单送壳膜套装】Apple/苹果iPhone 11全网通4G手机8PXs苹果11新x官方旗舰店iPhone11 pro国行max'] ['\n翼天下天翼电信旗舰店\n']
['10358.00'] ['现货送无线充/24期分期Apple苹果iPhone 11 Pro MAX全网通官xsmax网旗舰店国行11promax新正品8P苹果11手机X'] ['\n三际数码官方旗舰店\n']
['5930.00'] ['Apple 苹果 iPhone 11(A2223) 全网通苹果11苹果手机双卡官方旗舰店 花呗 苹果xr xsmax 8plus'] ['\n四川移动官方旗舰店\n']
['10899.00'] ['【12期免息】Apple/苹果 iPhone 11 Pro MAX 2019新品 全网通手机 苹果11promax 拍照智能手机'] ['\n绿森数码官方旗舰店\n']
['5349.00'] ['【顺丰发货 下单送壳膜套装】Apple/苹果 iPhone 11全网通4G手机 苹果11新x天翼电信官方旗舰店官网国行XS 8p'] ['\n翼天下天翼电信旗舰店\n']
['10358.00'] ['【购机送无线充电器】Apple/苹果 iPhone 11 Pro Max苹果手机中移动新款全网通手机苹果xr xsmax 8plus'] ['\n中国移动官方旗舰店\n']
['9628.00'] ['【购机送无线充电器】苹果11 Pro Apple/苹果 iPhone 11Pro苹果手机中移动2019新款全网通苹果xr xsmax 8plus'] ['\n中国移动官方旗舰店\n']
['5358.00'] ['【购机送无线充电器】 苹果11 Apple/iPhone 11苹果手机中移动2019新款全网通智能手机苹果xr xsmax 7plus'] ['\n中国移动官方旗舰店\n']
['5999.00'] ['【中国移动 正品保障】苹果xs max Apple/苹果 iPhone XS Max手机中移动iPhone xs 11Pro Max xr 7plus手机'] ['\n中国移动官方旗舰店\n']
['5888.00'] ['当天发【24期分期/送无线充】Apple/苹果 iPhone 11 手机现货4G全网通新款iphone11 pro max国行正品保证xs'] ['\n博盛景数码专营店\n']
['5398.00'] ['【中国移动 正品保障】苹果xs Apple/苹果 iPhone XS手机全网通中移动iPhone XS Max 11Pro max xr 7plus手机'] ['\n中国移动官方旗舰店\n']
['5358.00'] ['【购机送无线充+咨询再享4选1】苹果11Apple/iPhone 11苹果手机2019新款全网通智能手机苹果xr xsmax 8plus'] ['\n君问数码官方旗舰店\n']
['4998.00'] ['24期分期/现货速发/iphone/Apple/苹果 iPhone XR 4G全网通手机官方旗舰店国行正品xr苹果11降价x xs11proMax'] ['\n三际数码官方旗舰店\n']
['5958.00'] ['【当天发 选送蓝牙耳机】Apple/苹果 iPhone 11全网通iphone11手机官网旗舰店正品xr官方pro国行8plus学生机'] ['\n轻松换数码旗舰店\n']
['6499.00'] ['蜜茶手机苹果xs iphone xs Apple/苹果 iphonexs 苹果手机xs 苹果xs手机 国行正品全网通苹果手机'] ['\n搜酷数码专营店\n']
['6968.00'] ['3期免息现货Apple苹果iPhoneXSMax6.5英寸双卡双待全网通移动电信联通4G智能手机64/256GB全新原封装国行正品'] ['\n岗隆数码专营店\n']
['6688.00'] ['【当天发货/24期分期】Apple/苹果iPhone 11官方旗舰店国行苹果11全网通4G手机x官方xr 8plus新品11pro xsmax'] ['\n能良数码官方旗舰店\n']
['5999.00'] ['【限时享12期免息】苹果11 Apple/iPhone 11苹果手机2019新款全网通手机苹果正品xr xsmax 7plus'] ['\n中国移动手机官方旗舰店\n']
['4598.00'] ['【中国移动 正品保障】苹果xr中移动Apple/苹果 iPhone XR全网通手机iphone 11 Pro max xr 7plus苹果xr正品'] ['\n中国移动官方旗舰店\n']
['9699.00'] ['【顺丰送壳膜套装 晒单送无线充】Apple苹果iPhone 11 Pro全网通智能4G手机电信官方旗舰店官网新x苹果11pro'] ['\n翼天下天翼电信旗舰店\n']
['6058.00'] ['【现货当天发/6期免息】Apple 苹果 iPhone 11 全网通4G手机8plus官方XR旗舰店11pro正品苹果iPhone11max'] ['\n能良数码官方旗舰店\n']
['7149.00'] ['【顺丰速发】Apple/苹果 iPhone XS Max 全网通版 苹果xsmax xr xs苹果11正品官方旗舰店Pro max'] ['\n中国移动手机官方旗舰店\n']
['5888.00'] ['【12期分期0首付 全国联保】Apple/苹果iPhone11官方旗舰店国行全网通4G手机官方xr xsmax 8plus'] ['\n高远数码旗舰店\n']
['5828.00'] ['【顺丰包邮】Apple/苹果iPhone 11#移动联通电信全网通4G智能手机 中国电信官方旗舰店'] ['\n中国电信官方旗舰店\n']
['5799.00'] ['蜜茶手机 Apple/苹果 iPhone 11 移动联通电信全网通4G智能全面屏手机 官方正品 全国联保iphone11 苹果11'] ['\n虫马虫义数码专营店\n']
['4319.00'] ['【12期分期】苹果8plus Apple/苹果 iPhone 8Plus手机中移动全网通iPhone xr 7plus xsmax 11Pro max正品手机'] ['\n中国移动官方旗舰店\n']
['6999.00'] ['蜜茶手机苹果xs max 12期分期 Apple/苹果 iPhone XS Max手机 苹果XSmax4G 全网通iphonexsmax max xsmax'] ['\n搜酷数码专营店\n']
['5398.00'] ['蜜茶手机 iPhone xr 全网通4G手机双卡双待 全新正品国行XR苹果手机 iphone xr 苹果iphonexr 苹果xr'] ['\n虫马虫义数码专营店\n']
['11188.00'] ['【12期免息】Apple/苹果iPhone 11 Pro Max 手机苹果11新品iphone11promax国行正品iphone13/iPhone xs max'] ['\n博盛景数码专营店\n']
['4999.00'] ['蜜茶手机Apple/苹果 iPhone XR 全网通4G手机双卡双待 全新国行 iPhonexr 手机 iphonexr 苹果xr iphone xr'] ['\n搜酷数码专营店\n']
['3849.00'] ['【中国移动 正品保障】苹果8Apple/苹果 iPhone 8手机全网通中移动iPhone xsmax 11Pro max xr 8plus手机正品'] ['\n中国移动官方旗舰店\n']
['3598.00'] ['【顺丰包邮+送壳膜套装】苹果7plus Apple/苹果iPhone 7Plus手机全网通中移动苹果手机iPhone 8plus xr xsmax'] ['\n中国移动官方旗舰店\n']
['3459.00'] ['【稀缺货源 限量抢购】Apple/苹果 iPhone 7 Plus 32G 全网通4G手机iPhone7plus'] ['\n苏宁易购官方旗舰店\n']
['5288.00'] ['5288元起/24期分期/苹果xs Apple/苹果 iPhone XS 4G全网通官方官网旗舰店正品11手机11pro苹果X 8p xsmax xr'] ['\n三际数码官方旗舰店\n']
['10388.00'] ['当天发货【24期分期/送无线充】Apple/苹果iPhone 11 Pro Max 手机苹果11新品iphone11promax国行正品13/xs'] ['\n博盛景数码专营店\n']
['3588.00'] ['12期分期/现货速发/苹果7plus Apple/苹果 iPhone 7 Plus 全网通官网官方旗舰店4G手机苹果11 6P 8 p xr x 7P'] ['\n三际数码官方旗舰店\n']
['10298.00'] ['【当天发货/24期分期】Apple/苹果iPhone 11 ProMAX 官网旗舰店全网通国行iPhone11手机xsmax苹果8plus 11pro'] ['\n能良数码官方旗舰店\n']
['5798.00'] ['24期分期Apple 苹果 iPhone 11 全网通智能4G苹果11正品手机xs官方官网旗舰店X新品11promax xr'] ['\n同迅数码专营店\n']
['9588.00'] ['24期分期/现货发/Apple苹果iPhone 11Pro全网通官网官方旗舰店7P国行xr正品8P手机xs苹果X降价新款苹果11max'] ['\n三际数码官方旗舰店\n']
['4299.00'] ['蜜茶手机Apple/苹果 iPhone 8 Plus 全新官方正品国行 全网通 原装 iphone8 plus 苹果8plus 苹果8P'] ['\n搜酷数码专营店\n'] Process finished with exit code 0
selenium 提取天猫网页数据的更多相关文章
- selenium跳过webdriver检测并爬取天猫商品数据
目录 简介 编写思路 使用教程 演示图片 源代码 @(文章目录) 简介 现在爬取淘宝,天猫商品数据都是需要首先进行登录的.上一节我们已经完成了模拟登录淘宝的步骤,所以在此不详细讲如何模拟登录淘宝.把关 ...
- 爬虫---selenium动态网页数据抓取
动态网页数据抓取 什么是AJAX: AJAX(Asynchronouse JavaScript And XML)异步JavaScript和XML.过在后台与服务器进行少量数据交换,Ajax 可以使网页 ...
- 实验楼的php比赛题,网页数据提取。
实验楼的php比赛题,网页数据提取. 题目的地址:https://www.shiyanlou.com/contests/lou5/challenges 以下代码是题目的答案 <?php head ...
- selenium抓取动态网页数据
1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...
- python爬虫-提取网页数据的三种武器
常用的提取网页数据的工具有三种xpath.css选择器.正则表达式 1.xpath 1.1在python中使用xpath必须要下载lxml模块: lxml官方文档 :https://lxml.de/i ...
- API例子:用Python驱动Firefox采集网页数据
1,引言 本文讲解怎样用Python驱动Firefox浏览器写一个简易的网页数据采集器.开源Python即时网络爬虫项目将与Scrapy(基于twisted的异步网络框架)集成,所以本例将使用Scra ...
- 使用webdriver+urllib爬取网页数据(模拟登陆,过验证码)
urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...
- 怎么用Python写爬虫抓取网页数据
机器学习首先面临的一个问题就是准备数据,数据的来源大概有这么几种:公司积累数据,购买,交换,政府机构及企业公开的数据,通过爬虫从网上抓取.本篇介绍怎么写一个爬虫从网上抓取公开的数据. 很多语言都可以写 ...
- Python爬虫学习教程:天猫商品数据爬虫
天猫商品数据爬虫使用教程 下载chrome浏览器 查看chrome浏览器的版本号,下载对应版本号的chromedriver驱动 pip安装下列包 pip install selenium pip in ...
随机推荐
- matlab数据插值
由图可见采样点前段比较稀疏,比较有规律,后段比较密集,比较复杂 这里的spline是三次样条插值 随着次数的增高,曲线在两端震荡的越来越剧烈 用上其他插值的方法 线性插值 最近点插值 分段三次米勒插值 ...
- 将lua编译进nginx
1.先安装lua-jit,网上说也可以下载lua,不过lua-jit效率比较高,地址:http://luajit.org/download.html我下的是2.0.3版本的下载解压后,直接make & ...
- hystrix熔断器之线程池
隔离 Hystrix有两种隔离方式:信号量和线程池. 线程池隔离:对每个command创建一个自己的线程池,执行调用.通过线程池隔离来保证不同调用不会相互干扰和每一个调用的并发限制. 信号量隔热:对每 ...
- 《图解 HTTP》 学习笔记
前言 本书对互联网基盘--HTTP协议进行了全面系统的介绍.作者由HTTP协议的发展历史娓娓道来,严谨细致地剖析了HTTP协议的结构,列举诸多常见通信场景及实战案例,最后延伸到Web安全.最新技术动向 ...
- dubbo学习(二)配置dubbo XML方式配置
provider(生产者) <beans xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dubbo= ...
- python自动保存百度网盘资源,一定要看
觉得有帮助的别忘了关注一下知识图谱与大数据公众号 开始 在上一文中,我们保存了百度云盘的地址和提取码,但是这种分享链接很容易被屏蔽,最好的做法就是保存资源到自己的网盘,不过采集的链接有上万个,人肉保存 ...
- 我要吹爆这份阿里中间件技术内部的RM笔记,简直佩服到五体投地
消息队列 RocketMQ 版是阿里云基于 Apache RocketMQ 构建的低延迟.高并发.高可用.高可靠的分布式消息中间件.该产品最初由阿里巴巴自研并捐赠给 Apache 基金会,服务于阿里集 ...
- VueX中state变化捕捉不到_getters监测不到state的变化
原因 可能有多种原因, 现在我说一下我碰到的一种情况: state种有一个变量叫state,它是一个json对象, 可把我害惨了.因为他这个json长这个样: messageBox:{ friendI ...
- osgEarth使用笔记4——加载矢量数据
目录 1. 概述 2. 详论 2.1. 基本绘制 2.2. 矢量符号化 2.2.1. 可见性 2.2.2. 高度设置 2.2.3. 符号化 2.2.4. 显示标注 2.3. 其他 3. 结果 4. 问 ...
- SQL实战——03. 查找各个部门当前(to_date='9999-01-01')领导当前薪水详情以及其对应部门编号dept_no
查找各个部门当前(to_date='9999-01-01')领导当前薪水详情以及其对应部门编号dept_noCREATE TABLE `dept_manager` (`dept_no` char(4) ...