python实现批量自动访问站点URL并获取内容，自动模拟打开电脑端及移动端URL访问站点，打开URL页面获取页面内容

问题描述：假设目前有多个网站URL，需要检查各站点keyword，description是否正常设置，如果人工逐个打开URL访问比较耗时，故采用python模拟电脑端和移动端自动打开网站URL访问，并记录下访问的结果，最终人工查看结果，对其中未正常配置的站点进行单独处理。

准备工作：计算机已正常安装python，selenium，BeautifulSoup且能正常运行python程序，读者可自行搜索安装方法，在此不做赘述。

1.模拟电脑端循环打开URL检查示例代码（只提供基础逻辑处理演示，读者可根据自己的实际业务需求进行编写）

from bs4 import BeautifulSoup
from selenium import webdriver
import datetime
now = datetime.datetime.now()
fname=now.strftime('%Y%m%d%H%M')+".txt" /*生成txt结果文档*/

def main(url):
driver = webdriver.Chrome()
driver.get(url)
html = driver.page_source
soup = BeautifulSoup(html)
title = soup.title.string
description = soup.find(attrs={"name": "description"})['content']
keywords = soup.find(attrs={"name": "keywords"})['content']
# print('title:', title)
# print('description:', description)
# print('keywords:', keywords)

with open('G:\\FinalOutput\\'+fname, 'a', encoding='utf-8') as file:   /*设置txt文件保存路径并写入，其中参数a表示追加内容，如果为w，则为覆盖写入，此处用到循环，故设置为a参数*/
file.write(
"网址是：" +url + "\n" + "标题是：" + title + "\n" + "描述是：" + description + "\n" + "关键词是：" + keywords + "\n\n")   /*输出内容设置编辑*/
urls = ['http://www.aaa.com', 'http://www.bbb.com’, 'http://www.ccc.com’]    /*需要访问的URL地址，需要加http或https，并能正常访问*/
for url in urls:   /*循环打开访问URL*/
if __name__ == '__main__':
main(url)

2.模拟移动端循环打开URL检查示例代码（只提供基础逻辑处理演示，读者可根据自己的实际业务需求进行编写）

from selenium import webdriver
import datetime

now = datetime.datetime.now()
fname = now.strftime('%Y%m%d%H%M') + "MOBILE.txt" /*生成txt结果文档*/

def main(url):
options = webdriver.ChromeOptions()
options.add_experimental_option('mobileEmulation', {'deviceName': 'iPhone X'}) /*模拟iPhone X浏览*/
driver = webdriver.Chrome(options=options)

driver.get(url)
page_source = driver.page_source
resp = page_source[20:600]      /*截取字符串，范围为20到600*/
with open('G:\\FinalOutput\\' + fname, 'a', encoding='utf-8') as file:   /*设置txt文件保存路径并写入，其中参数a表示追加内容，如果为w，则为覆盖写入，此处用到循环，故设置为a参数*/
file.write("网址是：" + url + "\n" + "结果是：" + resp + "\n\n")    /*输出内容设置编辑*/

urls = ['https://www.ggg.com./', 'http://www.fff.com/'] /*需要访问的URL地址，需要加http或https，并能正常访问*/
for url in urls: /*循环打开访问URL*/
if __name__ == '__main__':
main(url)

python实现批量自动访问站点URL并获取内容，自动模拟打开电脑端及移动端URL访问站点，打开URL页面获取页面内容的更多相关文章

from appium import webdriver 使用python爬虫,批量爬取抖音app视频（requests+Fiddler+appium）
使用python爬虫,批量爬取抖音app视频(requests+Fiddler+appium) - 北平吴彦祖 - 博客园 https://www.cnblogs.com/stevenshushu/p ...
使用python爬虫,批量爬取抖音app视频（requests+Fiddler+appium）
抖音很火,楼主使用python随机爬取抖音视频,并且无水印下载,人家都说天下没有爬不到的数据,so,楼主决定试试水,纯属技术爱好,分享给大家.. 1.楼主首先使用Fiddler4来抓取手机抖音app这 ...
用python+selenium将腾讯首页今日话题的内容自动发表到自己cnblog里
目的:使用pyhton下的unittest单元测试框架并结合selenium的webdriver来实现将腾讯首页的今日话题下的内容自动发表达到自己的cnblog里. 思路:创建QQDailyTopic ...
Python基于Python实现批量上传文件或目录到不同的Linux服务器
基于Python实现批量上传文件或目录到不同的Linux服务器 by:授客 QQ:1033553122 实现功能 1 测试环境 1 使用方法 1 1. 编辑配置文件conf/rootpath_fo ...
第四百零一节，Django+Xadmin打造上线标准的在线教育平台—生产环境部署virtualenv虚拟环境安装，与Python虚拟环境批量安装模块
第四百零一节,Django+Xadmin打造上线标准的在线教育平台—生产环境部署virtualenv虚拟环境安装,与Python虚拟环境批量安装模块 virtualenv简介 1.安装virtuale ...
Python爬虫实战三之实现山东大学无线网络掉线自动重连
综述最近山大软件园校区QLSC_STU无线网掉线掉的厉害,连上之后平均十分钟左右掉线一次,很是让人心烦,还能不能愉快地上自习了?能忍吗?反正我是不能忍了,嗯,自己动手,丰衣足食!写个程序解决掉它! ...
【转】Python编程: 多个PDF文件合并以及网页上自动下载PDF文件
1. 多个PDF文件合并1.1 需求描述有时候,我们下载了多个PDF文件, 但希望能把它们合并成一个PDF文件.例如:你下载的数个PDF文件资料或者电子发票,你可以使用python程序合并成一个PDF ...
python打造批量关键词排名查询工具
自己做站点的时候,都看看收录和关键词排名什么的,所以打造的这个批量关键词查询工具. #encoding:utf-8 import urllib,re,random,time,sys,StringIO, ...
python虚拟环境 + 批量pip + 换源
python虚拟环境 + 批量pip + 换源虚拟环境曾经我是一个小白,不管运行什么项目都用一个环境,后来项目多了,有的是Django1.11的有的是Django2的,有的项目只能在3.6上运行, ...
python脚本批量生成数据
在平时的工作中,经常会遇到造数据,特别是性能测试的时候更是需要大量的数据.如果一条条的插入数据库或者一条条的创建数据,效率未免有点低.如何快速的造大量的测试数据呢?在不熟悉存储过程的情况下,今天给大家 ...

随机推荐

Redis 中 scan 命令踩坑
原本以为自己对redis命令还蛮熟悉的,各种数据模型各种基于redis的骚操作.但是最近在使用redis的scan的命令式却踩了一个坑,顿时发觉自己原来对redis的游标理解的很有限.所以记录下这个踩 ...
unsupported message type: DefaultFullHttpResponse (expected: ByteBuf, FileRegion) 原因以及解决办法
使用netty做http服务器的时候用android链接会出现这个错误原因是http-aggregator顺序有问题 (ps:目前大部分国内博客都是这个排序有点坑爹): 官方文档说明:For c ...
波折重重：Linux实时系统Xenomai宕机问题的深度定位
目录一前言二背景三原因分析及措施硬件原因应用软件操作系统四分析定位转机拨云见雾 irq计数 Schedstat coreclk 现象结论五原因一六原因二七解决八 ...
即时通讯技术文集（第41期）：直播技术合集(Part1) [共12篇]
为了更好地分类阅读 52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第41 期. [- 1 -] 移动端实时音视频直播技术详解(一):开篇 [链接] http:// ...
在linux上Git配置多个SSH-Key
Git配置多个SSH-Key SSH Key 背景当有多个git账号时,比如: a. 一个gitee,用于公司内部的工作开发: b. 一个github,用于自己进行一些开发活动: c.一个gitla ...
python创建项目虚拟环境
创建一个文件夹用于存放你的虚拟环境 cd 到存放虚拟环境的地址安装虚拟环境库: pip3 install virtualenv 创建虚拟环境:python3 -m venv 环境名称激活虚拟环境: ...
CDS标准视图：功能位置 I_FunctionalLocation
视图名称:I_FunctionalLocation 视图类型:基础视图代码: 点击查看代码 @EndUserText.label: 'Functional Location' @Analytics: ...
w3cschool-memcached教程
https://www.w3cschool.cn/memcached/ Memcached 教程 Memcached是一个自由开源的,高性能,分布式内存对象缓存系统. 手册简介 Memcached ...
a链接被点击后，在跳转之前的处理事件
在HTML中,<a> 标签通常用于创建链接,使用户能够点击并跳转到另一个页面或网址.如果你想在跳转前处理一些事件,你可以使用JavaScript来实现这一功能. 以下是一个简单的示例,展示 ...
linux如何使用ssh进行远程服务
/*********************linux SSH 简单学习********************/ 什么是SSH SSH 为 Secure Shell 的缩写,由 IETF 的网络小组 ...

python实现批量自动访问站点URL并获取内容，自动模拟打开电脑端及移动端URL访问站点，打开URL页面获取页面内容

python实现批量自动访问站点URL并获取内容，自动模拟打开电脑端及移动端URL访问站点，打开URL页面获取页面内容的更多相关文章

随机推荐

热门专题