selenium 提取天猫网页数据
from time import sleep
from selenium import webdriver br = webdriver.Chrome() url = "https://www.tmall.com"
br.get(url) input = br.find_element_by_id("mq")
input.clear()
input.click()
input.send_keys("iphone")
input.submit() from lxml import etree html = etree.HTML(br.page_source) # 方式一 单独获取所有单标签后,组合 如果某个数据少了,容易错位,不推荐
# prices = html.xpath('//*[@id="J_ItemList"]/div//p[@class="productPrice"]/em/text()')
# titles = html.xpath('//*[@id="J_ItemList"]/div//p[@class="productTitle"]/a/@title')
# shops = html.xpath('//*[@id="J_ItemList"]/div//div[@class="productShop"]/a/text()')
# imgs = html.xpath('//*[@id="J_ItemList"]/div//div[@class="productImg-wrap"]//a/img/@src')
#
# list = list(zip(titles,prices,shops,imgs))
# print(list)
# print(len(list)) products = html.xpath('//div[@id="J_ItemList"]//div[@class="product-iWrap"]') for product in products:
price = product.xpath('./p[@class="productPrice"]/em/@title')
title = product.xpath('./p[@class="productTitle"]/a/@title')
shop = product.xpath('./div[@class="productShop"]/a/text()')
print(price,title,shop)
结果
C:\Users\brady\.conda\envs\python36\python.exe E:/www/djangotest/test_selenium.py
['3499.00'] ['Apple/苹果 iPhone 8'] ['\nApple Store 官方旗舰店\n']
['4999.00'] ['Apple/苹果 iPhone 8 Plus'] ['\nApple Store 官方旗舰店\n']
['5999.00'] ['Apple/苹果 iPhone 11'] ['\nApple Store 官方旗舰店\n']
['5999.00'] ['【12期免息 下单减200元】Apple/苹果 iPhone 11全网通4G 超广角拍照手机苏宁易购官方store苹果11'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['【下单立减700元】Apple/苹果 iPhone 11 Pro Max 全网通4G智能手机苏宁易购官方旗舰店苹果11ProMax'] ['\n苏宁易购官方旗舰店\n']
['5999.00'] ['【12期免息 下单减200】Apple/苹果 iPhone 11 移动联通电信4G全网通智能手机正品苏宁易购官方旗舰店苹果11'] ['\n苏宁易购官方旗舰店\n']
['9999.00'] ['【12期0息 再减500元】Apple/苹果 iPhone 11 Pro全网通4G智能手机 苏宁易购官方旗舰店 苏宁直发 苹果11pro'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['【12期0息 再减700元】Apple/苹果 iPhone 11 Pro Max 全网通4G智能手机 苏宁易购官方旗舰店苹果11Promax'] ['\n苏宁易购官方旗舰店\n']
['9999.00'] ['【下单立减500元】Apple/苹果 iPhone 11 Pro移动联通电信4G全网通手机苏宁易购官方旗舰店苹果11pro'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['Apple/苹果 iPhone 11 Pro Max'] ['\nApple Store 官方旗舰店\n']
['5088.00'] ['【下单最高减289元】Apple/苹果 iPhone XR全网通4G 双卡双待手机苏宁易购官方旗舰店 苹果iPhoneXR'] ['\n苏宁易购官方旗舰店\n']
['4388.00'] ['【下单立减189元】Apple/苹果 iPhone 8 Plus 64G 全网通4G手机 官方正品苹果iPhone8plus 苹果8p'] ['\n苏宁易购官方旗舰店\n']
['5999.00'] ['【限时享12期免息/现货速发】苹果11 Apple/iPhone 11苹果手机2019新款全网通智能手机正品xr xsmax 7plu'] ['\n中国移动手机官方旗舰店\n']
['5299.00'] ['Apple/苹果 iPhone XR'] ['\nApple Store 官方旗舰店\n']
['4449.00'] ['【限时享12期免息】Apple/苹果 iPhone 8 Plus 全网通4G智能手机iphone8plus 苹果8p 苏宁易购官方旗舰店'] ['\n苏宁易购官方旗舰店\n']
['5888.00'] ['当天发货/24期分期Apple 苹果 iPhone 11全网通苹果11正品手机X国行官方xr官网8Plus旗舰店xsmax新品11promax'] ['\n三际数码官方旗舰店\n']
['5358.00'] ['【购机送无线充电器】苹果11 中移动Apple/iPhone 11苹果手机2019新款全网通智能手机苹果xr xsmax 7plus正品'] ['\n中国移动官方旗舰店\n']
['5299.00'] ['【限时享12期免息】Apple/苹果 iPhone XR 64G/128G 全网通4G智能手机双卡双待iphonexr 苹果XR'] ['\n苏宁易购官方旗舰店\n']
['6888.00'] ['5888元起 24期分期现货苹果xsmax Apple/苹果 iPhone XS Max 官网官方旗舰店全网通11pro手机X苹果8P xr xs 7'] ['\n三际数码官方旗舰店\n']
['9999.00'] ['Apple/苹果 iPhone 11 Pro'] ['\nApple Store 官方旗舰店\n']
['5349.00'] ['【顺丰发货 下单送壳膜套装】Apple/苹果iPhone 11全网通4G手机8PXs苹果11新x官方旗舰店iPhone11 pro国行max'] ['\n翼天下天翼电信旗舰店\n']
['10358.00'] ['现货送无线充/24期分期Apple苹果iPhone 11 Pro MAX全网通官xsmax网旗舰店国行11promax新正品8P苹果11手机X'] ['\n三际数码官方旗舰店\n']
['5930.00'] ['Apple 苹果 iPhone 11(A2223) 全网通苹果11苹果手机双卡官方旗舰店 花呗 苹果xr xsmax 8plus'] ['\n四川移动官方旗舰店\n']
['10899.00'] ['【12期免息】Apple/苹果 iPhone 11 Pro MAX 2019新品 全网通手机 苹果11promax 拍照智能手机'] ['\n绿森数码官方旗舰店\n']
['5349.00'] ['【顺丰发货 下单送壳膜套装】Apple/苹果 iPhone 11全网通4G手机 苹果11新x天翼电信官方旗舰店官网国行XS 8p'] ['\n翼天下天翼电信旗舰店\n']
['10358.00'] ['【购机送无线充电器】Apple/苹果 iPhone 11 Pro Max苹果手机中移动新款全网通手机苹果xr xsmax 8plus'] ['\n中国移动官方旗舰店\n']
['9628.00'] ['【购机送无线充电器】苹果11 Pro Apple/苹果 iPhone 11Pro苹果手机中移动2019新款全网通苹果xr xsmax 8plus'] ['\n中国移动官方旗舰店\n']
['5358.00'] ['【购机送无线充电器】 苹果11 Apple/iPhone 11苹果手机中移动2019新款全网通智能手机苹果xr xsmax 7plus'] ['\n中国移动官方旗舰店\n']
['5999.00'] ['【中国移动 正品保障】苹果xs max Apple/苹果 iPhone XS Max手机中移动iPhone xs 11Pro Max xr 7plus手机'] ['\n中国移动官方旗舰店\n']
['5888.00'] ['当天发【24期分期/送无线充】Apple/苹果 iPhone 11 手机现货4G全网通新款iphone11 pro max国行正品保证xs'] ['\n博盛景数码专营店\n']
['5398.00'] ['【中国移动 正品保障】苹果xs Apple/苹果 iPhone XS手机全网通中移动iPhone XS Max 11Pro max xr 7plus手机'] ['\n中国移动官方旗舰店\n']
['5358.00'] ['【购机送无线充+咨询再享4选1】苹果11Apple/iPhone 11苹果手机2019新款全网通智能手机苹果xr xsmax 8plus'] ['\n君问数码官方旗舰店\n']
['4998.00'] ['24期分期/现货速发/iphone/Apple/苹果 iPhone XR 4G全网通手机官方旗舰店国行正品xr苹果11降价x xs11proMax'] ['\n三际数码官方旗舰店\n']
['5958.00'] ['【当天发 选送蓝牙耳机】Apple/苹果 iPhone 11全网通iphone11手机官网旗舰店正品xr官方pro国行8plus学生机'] ['\n轻松换数码旗舰店\n']
['6499.00'] ['蜜茶手机苹果xs iphone xs Apple/苹果 iphonexs 苹果手机xs 苹果xs手机 国行正品全网通苹果手机'] ['\n搜酷数码专营店\n']
['6968.00'] ['3期免息现货Apple苹果iPhoneXSMax6.5英寸双卡双待全网通移动电信联通4G智能手机64/256GB全新原封装国行正品'] ['\n岗隆数码专营店\n']
['6688.00'] ['【当天发货/24期分期】Apple/苹果iPhone 11官方旗舰店国行苹果11全网通4G手机x官方xr 8plus新品11pro xsmax'] ['\n能良数码官方旗舰店\n']
['5999.00'] ['【限时享12期免息】苹果11 Apple/iPhone 11苹果手机2019新款全网通手机苹果正品xr xsmax 7plus'] ['\n中国移动手机官方旗舰店\n']
['4598.00'] ['【中国移动 正品保障】苹果xr中移动Apple/苹果 iPhone XR全网通手机iphone 11 Pro max xr 7plus苹果xr正品'] ['\n中国移动官方旗舰店\n']
['9699.00'] ['【顺丰送壳膜套装 晒单送无线充】Apple苹果iPhone 11 Pro全网通智能4G手机电信官方旗舰店官网新x苹果11pro'] ['\n翼天下天翼电信旗舰店\n']
['6058.00'] ['【现货当天发/6期免息】Apple 苹果 iPhone 11 全网通4G手机8plus官方XR旗舰店11pro正品苹果iPhone11max'] ['\n能良数码官方旗舰店\n']
['7149.00'] ['【顺丰速发】Apple/苹果 iPhone XS Max 全网通版 苹果xsmax xr xs苹果11正品官方旗舰店Pro max'] ['\n中国移动手机官方旗舰店\n']
['5888.00'] ['【12期分期0首付 全国联保】Apple/苹果iPhone11官方旗舰店国行全网通4G手机官方xr xsmax 8plus'] ['\n高远数码旗舰店\n']
['5828.00'] ['【顺丰包邮】Apple/苹果iPhone 11#移动联通电信全网通4G智能手机 中国电信官方旗舰店'] ['\n中国电信官方旗舰店\n']
['5799.00'] ['蜜茶手机 Apple/苹果 iPhone 11 移动联通电信全网通4G智能全面屏手机 官方正品 全国联保iphone11 苹果11'] ['\n虫马虫义数码专营店\n']
['4319.00'] ['【12期分期】苹果8plus Apple/苹果 iPhone 8Plus手机中移动全网通iPhone xr 7plus xsmax 11Pro max正品手机'] ['\n中国移动官方旗舰店\n']
['6999.00'] ['蜜茶手机苹果xs max 12期分期 Apple/苹果 iPhone XS Max手机 苹果XSmax4G 全网通iphonexsmax max xsmax'] ['\n搜酷数码专营店\n']
['5398.00'] ['蜜茶手机 iPhone xr 全网通4G手机双卡双待 全新正品国行XR苹果手机 iphone xr 苹果iphonexr 苹果xr'] ['\n虫马虫义数码专营店\n']
['11188.00'] ['【12期免息】Apple/苹果iPhone 11 Pro Max 手机苹果11新品iphone11promax国行正品iphone13/iPhone xs max'] ['\n博盛景数码专营店\n']
['4999.00'] ['蜜茶手机Apple/苹果 iPhone XR 全网通4G手机双卡双待 全新国行 iPhonexr 手机 iphonexr 苹果xr iphone xr'] ['\n搜酷数码专营店\n']
['3849.00'] ['【中国移动 正品保障】苹果8Apple/苹果 iPhone 8手机全网通中移动iPhone xsmax 11Pro max xr 8plus手机正品'] ['\n中国移动官方旗舰店\n']
['3598.00'] ['【顺丰包邮+送壳膜套装】苹果7plus Apple/苹果iPhone 7Plus手机全网通中移动苹果手机iPhone 8plus xr xsmax'] ['\n中国移动官方旗舰店\n']
['3459.00'] ['【稀缺货源 限量抢购】Apple/苹果 iPhone 7 Plus 32G 全网通4G手机iPhone7plus'] ['\n苏宁易购官方旗舰店\n']
['5288.00'] ['5288元起/24期分期/苹果xs Apple/苹果 iPhone XS 4G全网通官方官网旗舰店正品11手机11pro苹果X 8p xsmax xr'] ['\n三际数码官方旗舰店\n']
['10388.00'] ['当天发货【24期分期/送无线充】Apple/苹果iPhone 11 Pro Max 手机苹果11新品iphone11promax国行正品13/xs'] ['\n博盛景数码专营店\n']
['3588.00'] ['12期分期/现货速发/苹果7plus Apple/苹果 iPhone 7 Plus 全网通官网官方旗舰店4G手机苹果11 6P 8 p xr x 7P'] ['\n三际数码官方旗舰店\n']
['10298.00'] ['【当天发货/24期分期】Apple/苹果iPhone 11 ProMAX 官网旗舰店全网通国行iPhone11手机xsmax苹果8plus 11pro'] ['\n能良数码官方旗舰店\n']
['5798.00'] ['24期分期Apple 苹果 iPhone 11 全网通智能4G苹果11正品手机xs官方官网旗舰店X新品11promax xr'] ['\n同迅数码专营店\n']
['9588.00'] ['24期分期/现货发/Apple苹果iPhone 11Pro全网通官网官方旗舰店7P国行xr正品8P手机xs苹果X降价新款苹果11max'] ['\n三际数码官方旗舰店\n']
['4299.00'] ['蜜茶手机Apple/苹果 iPhone 8 Plus 全新官方正品国行 全网通 原装 iphone8 plus 苹果8plus 苹果8P'] ['\n搜酷数码专营店\n'] Process finished with exit code 0
selenium 提取天猫网页数据的更多相关文章
- selenium跳过webdriver检测并爬取天猫商品数据
目录 简介 编写思路 使用教程 演示图片 源代码 @(文章目录) 简介 现在爬取淘宝,天猫商品数据都是需要首先进行登录的.上一节我们已经完成了模拟登录淘宝的步骤,所以在此不详细讲如何模拟登录淘宝.把关 ...
- 爬虫---selenium动态网页数据抓取
动态网页数据抓取 什么是AJAX: AJAX(Asynchronouse JavaScript And XML)异步JavaScript和XML.过在后台与服务器进行少量数据交换,Ajax 可以使网页 ...
- 实验楼的php比赛题,网页数据提取。
实验楼的php比赛题,网页数据提取. 题目的地址:https://www.shiyanlou.com/contests/lou5/challenges 以下代码是题目的答案 <?php head ...
- selenium抓取动态网页数据
1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...
- python爬虫-提取网页数据的三种武器
常用的提取网页数据的工具有三种xpath.css选择器.正则表达式 1.xpath 1.1在python中使用xpath必须要下载lxml模块: lxml官方文档 :https://lxml.de/i ...
- API例子:用Python驱动Firefox采集网页数据
1,引言 本文讲解怎样用Python驱动Firefox浏览器写一个简易的网页数据采集器.开源Python即时网络爬虫项目将与Scrapy(基于twisted的异步网络框架)集成,所以本例将使用Scra ...
- 使用webdriver+urllib爬取网页数据(模拟登陆,过验证码)
urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...
- 怎么用Python写爬虫抓取网页数据
机器学习首先面临的一个问题就是准备数据,数据的来源大概有这么几种:公司积累数据,购买,交换,政府机构及企业公开的数据,通过爬虫从网上抓取.本篇介绍怎么写一个爬虫从网上抓取公开的数据. 很多语言都可以写 ...
- Python爬虫学习教程:天猫商品数据爬虫
天猫商品数据爬虫使用教程 下载chrome浏览器 查看chrome浏览器的版本号,下载对应版本号的chromedriver驱动 pip安装下列包 pip install selenium pip in ...
随机推荐
- [LeetCode]面试题53 - I. 在排序数组中查找数字 I(二分);面试题53 - II. 0~n-1中缺失的数字(二分)
##面试题53 - I. 在排序数组中查找数字 I ###题目 统计一个数字在排序数组中出现的次数. 示例 1: 输入: nums = [5,7,7,8,8,10], target = 8 输出: 2 ...
- 面试官:哪些场景会产生OOM?怎么解决?
这个面试题是一个朋友在面试的时候碰到的,什么时候会抛出OutOfMemery异常呢?初看好像挺简单的,其实深究起来考察的是对整个JVM的了解,而且这个问题从网上可以翻到一些乱七八糟的答案,其实在总结下 ...
- Linux实战(5):Centos8安装python
Centos8正式版已经发布了,已经尝鲜的小伙伴们会发现与其他Linux发行版不同,CentOS 8默认不安装Python.接下来的操作指导大家如何安装python3. 转自链接 安装python3 ...
- redis哨兵机制--配置文件sentinel.conf详解
转载自 https://blog.csdn.net/u012441222/article/details/80751390 Redis的哨兵机制是官方推荐的一种高可用(HA)方案,我们在使用Redis ...
- asp.net core 从 3.1 到 5.0
asp.net core 从 3.1 到 5.0 Intro 就在前几天,微软宣布了 .NET5 发布了 RC1 版本,这也意味着 .NET5 的开发基本稳定了,正式发布之前,不会再新增新的 Feat ...
- tkMybatis和Mybatis Generator的结合使用
tkMybatis配置 tkmybatis是基于Mybatis框架开发的一个工具,通过调用它提供的方法实现对单表的数据操作,以免写任何sql语句. tkMybatis通常与Mybatis以及Mybat ...
- 关于KeePass基于csv格式的批量导入与导出
在KeePass的导出选项中,有一个KeePass CSV(1.x),导出后格式如下: "Account","Login Name","Passwor ...
- xss利用——BeEF#stage4(其余功能介绍)
目录 信息收集 => 社会工程 =>网络扫描 => 结合metasploit => tunneling => xss => 维持权限 功能介绍 #1 - 信息收集 ...
- DVWA SQL-injection 附python脚本
SQL-Injection low等级 首先我们将dvwa等级调到low 如图 接下来选择SQL Injection,并在提交框中输入正常值1,查看返回结果 接下来检测是否存在注入,分别输入 1' a ...
- HTTP协议学习之Request学习
在开始前,我们首先对HTTP协议做个简单的了解 HTTP协议(Hyper Text Transfer Protocol) 超文本传输协议 名词非常的高大上,如果学过计算机网络这门课(再如果还有一点印象 ...