0627.selenium请求库*2

昨天已经介绍了关于selenium的简单基本基本使用——通过两种方式自动打开和关闭谷歌浏览器今天，我们将介绍的模块将是在昨天打开谷歌浏览器的基础上，打开某一个电商平台，并搜索某一个产品，利用前面学的知识将所有产品的信息爬取出来。

我们以打开京东官网为例：

建立try模块，捕获异常

try:

# 捕获异常

except Exception as e:

    print(e)

# 不论发生什么异常，都会驱动浏览器关闭

finally:

    driver.close()

向京东主页发送请求

# 往京东主页发送请求

driver.get('https://www.jd.com/')

输入商品名目

# 通过id查找input输入框

input_tag = driver.find_element_by_id('key')

# send_keys为当前标签传值

input_tag.send_keys('公仔')

# 按键盘的回车键

input_tag.send_keys(Keys.ENTER)

time.sleep(3)

通过for循环遍历每一个商品

for good in good_list:

       # 通过属性选择器查找商品详情页url

       # url

       good_url = good.find_element_by_css_selector('.p-img a').get_attribute('href')

       print(good_url)

       # 名称

       good_name = good.find_element_by_css_selector('.p-name em').text

       print(good_name)

       # 价格

       good_price = good.find_element_by_class_name('p-price').text

       print(good_price)

       # 评价数

       good_commit = good.find_element_by_class_name('p-commit').text

       print(good_commit)

       str1 = f'''

       url: {good_url}

       名称: {good_name}

       价格: {good_price}

       评价: {good_commit}

       \n

       '''

把商品信息储存到文本中

# 把商品信息写入文本中

    with open('jd.txt', 'a', encoding='utf-8') as f:

        f.write(str1)

0627.selenium请求库*2的更多相关文章

爬虫（二）—— 请求库（二）selenium请求库
目录 selenium请求库一.什么是selenium 二.环境搭建三.使用selenium模块 1.使用chrome并设置为无GUI模式 2.使用chrome有GUI模式 3.显示等待与隐式等待 ...
day04 Selenium请求库
1.什么是Selenium? Selenium是一个自动测试工具,它可以帮我通过代码去实现驱动浏览器自动执行相应的操作. 所以我们也可以用它来做爬虫. 2.为什么要适用s ...
Selenium请求库
阅读目录一介绍二安装三基本使用四等待元素被加载五选择器六元素交互操作七其他八项目练习九破解登录验证一介绍 1.selenium是什么? selenium最初是一 ...
爬虫：selenium请求库
一.介绍二.安装三.基本使用四.选择器五.等待元素被加载六.元素交互操作七.其他八.项目练习一.介绍 # selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requ ...
第二十六节：urllib、requests、selenium请求库代理设置
1.urllib代理设置 1 from urllib.error import URLError 2 from urllib.request import ProxyHandler 3 from ur ...
关于python请求库Selenium安装所遇到的问题
今天,初次接触python,在网上买了一本关于爬虫的书,因为之前电脑上存在python,所以就对着书直接进行的请求库的安装,安装的时候,主要遇到了下边一个问题,在安装Selenium的时候,出现以下提 ...
Python3 网络爬虫（请求库的安装）
Python3 网络爬虫(请求库的安装) 爬虫可以简单分为几步:抓取页面,分析页面和存储数据在页面爬取的过程中我们需要模拟浏览器向服务器发送请求,所以需要用到一些python库来实现HTTP的请求操 ...
爬虫请求库——requests
请求库,即可以模仿浏览器对网站发起请求的模块(库). requests模块使用requests可以模拟浏览器的请求,requests模块的本质是封装了urllib3模块的功能,比起之前用到的urll ...
爬虫（一）—— 请求库（一）requests请求库
目录 requests请求库爬虫:爬取.解析.存储一.请求二.响应三.简单爬虫四.requests高级用法五.session方法(建议使用) 六.selenium模块 requests请求 ...
小白学 Python 爬虫（32）：异步请求库 AIOHTTP 基础入门
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...

随机推荐

GitHub - 电脑经常无法访问GitHub页面
来自这里 1.打开Dns检测|Dns查询 - 站长工具2.在检测输入栏中输入http://github.com官网3.把检测列表里的TTL值最小的IP输入到host里,并对应写上github官网域名. ...
Excelize 2.7.0 发布, 2023 年首个更新
Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库,基于 ECMA-376,ISO/IEC 29500 国际标准.可以使用它来读取.写入由 Microsoft Exc ...
SSM框架——SpringMVC
SpringMVC MVC三层架构 Controller层:取得前端数据.调用相关业务逻辑.转发/重定向到其他页面 Model层:实现业务逻辑.保存数据 View层:显示页面 1.第一个MVC程序新 ...
[C#]简单的理解委托和事件
委托在C++中可以利用"函数指针"将对方法的引用作为实参传递给另一个方法,而C#中可以利用委托提供相同的功能. 委托-内部机制但是委托实际上是一个特殊的类.委托必须直接或间接的 ...
P8474 「GLR-R3」立春
简要题意 \(\tau(\sigma)\) 表示排列 \(\sigma\) 的逆序对个数,求: \[\sum_{i \in \operatorname{permutation(n)}}2^{\tau( ...
JS实现excel数据透析，形成关系图
网上查了好多例子,都没有找到答案,只能自己硬着头皮写了想要的样子: 下面是DEMO,已经实现效果了!!!! 举例导入 <!DOCTYPE html> <html lang=&q ...
用if语句替换三元运算符-标准的switch语句
用if语句替换三元运算符在某些简单的应用中,if语句是可以和三元运算符互换使用的. public static void main(String[] args) { int a = 10; int ...
JAVA虚拟机20-基于栈的解释器执行过程示例
1.准备代码 public int calc() { int a = 100; int b = 200; int c = 300; return (a + b) * c; } 2.使用javap -v ...
Docker安装elasticsearch、kibana
一.Docker 安装elasticsearch 7.10 1. 拉取镜像 docker pull docker.elastic.co/elasticsearch/elasticsearch:7.10 ...
Slave_IO_Running: Connecting--一种问题的解决方案
主要有三个原因: 1.网络不同 2.密码不对 3.pos不对这里只介绍我碰到的问题--不能远程连接数据库.即在从机上对主机进行以下命令 mysql -u**** -p**** -h192.168.* ...

0627.selenium请求库*2

0627.selenium请求库*2的更多相关文章

随机推荐

热门专题