requests模块和openpyxl模块

第三方模块的下载和使用

1，第三方模块就是别人大神们已经写好的模块，功能特别强大。我们如果像使用第三方模块就先要进行下载。下载完成后

才可以在python中直接调用

2.下载方式一：pip工具

  	pip工具

    	注意每个解释器都有pip工具 如果我们的电脑上有多个版本的解释器那么我们在使用pip的时候一定要注意到底用的是哪一个 否则极其任意出现使用的是A版本解释器然后用B版本的pip下载模块

       为了避免pip冲突 我们在使用的时候可以添加对应的版本号

    	   python27			 pip2.7

     	  python36			pip3.6

         python38			pip3.8

  		下载第三方模块的句式

        	pip install 模块名

       下载第三方模块临时切换仓库

    		 pip install 模块名 -i 仓库地址

       下载第三方模块指定版本(不指定默认是最新版)

    		 pip install 模块名==版本号 -i 仓库地址

 3.pycharm内部快捷下载

   进入pycharm设置 settings页面 然后选择 python interpreter 然后选择 添加 搜索您需要的模块下载即可。

 4.如果下载速度非常慢，建议更改仓库地址  pip install -i 仓库地址

  	pip的仓库地址有很多 百度查询即可

		清华大学 ：https://pypi.tuna.tsinghua.edu.cn/simple/

		阿里云：http://mirrors.aliyun.com/pypi/simple/

		中国科学技术大学 ：http://pypi.mirrors.ustc.edu.cn/simple/

		华中科技大学：http://pypi.hustunique.com/

		豆瓣源：http://pypi.douban.com/simple/

		腾讯源：http://mirrors.cloud.tencent.com/pypi/simple

		华为镜像源：https://repo.huaweicloud.com/repository/pypi/simple/

网络爬虫模块之requests模块

requests模块可以帮助我们模拟浏览器发送网络请求，

import requests 

res = requests.get('需要查询的网址')

# 相当于我们获取指定网页的页面数据，相当于浏览器地址栏输入网址访问

res.text #获取字符串类型的网页数据

res.content #获取bytes类型的网页数据( 二进制 )

data = res.text

#直接可以用变量名接收到这个网页的全部数据

网络爬虫实战之爬取链接数据

import requests

import re

res = requests.get('https://xinxiang.lianjia.com/ershoufang/muyequ/l3/')

#发送网络请求

data = res.text

#将请求的文件编出字符串类型接收

with open('data.txt', 'w', encoding='utf8') as f:

    f.write(data)

house_name = re.findall('data-housecode=".*?" data-is_focus="" data-sl="">(.*?)</a>', data)   #通过正则法找到房名

house_place = re.findall('<a href="https://xinxiang.lianjia.com/ershoufang/.*?" target="_blank">(.*?)</a>', data)#通过正则法找到信息

house_info = re.findall('<span class="houseIcon"></span>(.*?)</div></div>', data)

house_money = re.findall('data-price=".*?"><span>(.*?)</span></div></div>', data)

house_money_all = re.findall('</i><span class="">(.*?)</span><i>万</i></div><div', data)

house_dict = zip(house_name, house_place, house_info, house_money, house_money_all)

# print(house_dict)

from openpyxl import Workbook

wb = Workbook()

wb1 = wb.create_sheet('新乡房产',0)

wb1.append(['房名','地址','信息','平方单价','总价'])

for i in house_dict:

     wb1.append(i)

wb.save(r'xinxiang_house.xlsx')

自动化办公领域之openpyxl模块

1.excel文件后缀名问题

在 03 版本之前 都是 .xls

在 03 版本之后 都是 .xlsx

2.操作excel表格的第三方模块

  openpyxl

  pandas

3.如果用openpyxl操作表格

 import openpyxl

wb = openpyxl.Workbook()

# 创建一个excel文件 workbook

wb1 = wb.create_sheet('工作薄1')

wb2 = wb.create_sheet('工作薄2')

wb3 = wb.create_sheet('工作薄3', 0)  #工作薄名字，位置

wb3.title = '工作薄重命名'

wb.save(r'111.xlsx')

wb3.append(['表头1', '表头2', '表头3'])

wb3.append([1, 2, 3])

wb.save(r'111.xlsx')

# openpyxl主要用于数据的写入 至于后续的表单操作它并不是很擅长 如果想做需要更高级的模块pandas

# excel软件正常可以打开操作的数据集最多10万条 一旦数据集过大 软件操作几乎无效

requests模块和openpyxl模块的更多相关文章

包、logging模块、hashlib模块、openpyxl模块、深浅拷贝
包.logging模块.hashlib模块.openpyxl模块.深浅拷贝一.包 1.模块与包模块的三种来源: 1.内置的 2.第三方的 3.自定义的模块的四种表现形式: 1.py文件 2.共享 ...
openpyxl模块（excel操作）
openpyxl模块介绍 openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到额外的库,openpyxl是一个比较综合的工具,能够同时读 ...
Python基础之模块：5、第三方模块 requests模块 openpyxl模块
目录一.第三方模块的下载与使用 1.什么是第三方模块 2.如何安装第三方模块方式一:pip工具方式二:pycharm中下载 3.注意事项 1.报错并有警告信息 2.报错,提示关键字 3.报错,无 ...
第四十节，requests模拟浏览器请求模块初识
requests模拟浏览器请求模块初识 requests模拟浏览器请求模块属于第三方模块源码下载地址http://docs.python-requests.org/zh_CN/latest/use ...
Python笔记（十四）：操作excel openpyxl模块
(一) 常遇到的情况就我自己来说,常遇到的情况可能就下面几种: 读取excel整个sheet页的数据. 读取指定行.列的数据往一个空白的excel文档写数据往一个已经有数据的excel文档追加 ...
使用openpyxl模块将Excel中的数据导入数据库
这里将不介绍openpyxl模块的详细操作. 主要就是记录一个使用openpyxl模块将Excel表格的数据导入数据库中的实例. from openpyxl import load_workbook ...
常用模块 - openpyxl模块
一.简介 xlrd/xlwt 主要是针对Office 2003或更早版本的XLS文件格式缺点:不支持XLSX文件格式 OpenPyXL 能读能写能修改缺点:不支持XLS Microsoft Exc ...
python3操作Excel openpyxl模块的使用
python 与excel 安装模块本例子中使用的模块为: openpyxl 版本为2.4.8 安装方法请参看以前发表的文章(Python 的pip模块安装方法) Python处理Excel表格使 ...
Python模块学习 - openpyxl
openpyxl模块介绍 openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到额外的库,openpyxl是一个比较综合的工具,能够同时读 ...
openpyxl模块处理excel文件
python模块之——openpyxl 处理xlsx/ xlsm文件项目原因需要编辑excel文件,经过查询,最先尝试xlwt .wlrd这个两个模块,但是很快发现这两个模块只能编辑xls文件,然而 ...

随机推荐

使用Docker Compose部署SpringCloud项目docker-compose.yml文件示例
注意各组件之间的依赖关系 microservice-discovery-eureka: image: reg.itmuch.com/microservice-discovery-eureka port ...
5G 与数字化转型的关系是怎样的？
5G提供的是通信网络服务,数字化转型需要网络服务,但并不是必须使用5G网络,也就是说5G在数字化转型中并不是必虚的,但可以作为备选项,不过在某些行业比如农业.林业.牧业.港口.建筑等布设有线网络.无线 ...
Netty 学习（八）：新连接接入源码说明
Netty 学习(八):新连接接入源码说明作者: Grey 原文地址: 博客园:Netty 学习(八):新连接接入源码说明 CSDN:Netty 学习(八):新连接接入源码说明新连接的接入分为3个 ...
离线安装chrome浏览器的postman插件
最近开始研究webapi相关的东西,看到chrome浏览器的有个postman插件挺好用的,但是安装包下载下来以后会出现这种情况,这时候我们可以把crx后缀的改成zip格式的然后解压,然后选择开发者模 ...
TensorFlow搭建模型方式总结
引言 TensorFlow提供了多种API,使得入门者和专家可以根据自己的需求选择不同的API搭建模型. 基于Keras Sequential API搭建模型 Sequential适用于线性堆叠的方式 ...
Hbase之理论
第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储. 官方 ...
魔改editormd组件，优化ToC渲染效果
前言我的StarBlog博客目前使用 editor.md 组件在前端渲染markdown文章,但这个组件自动生成的ToC(内容目录)不是很美观,我之前魔改过一个树形组件 BootStrap-Tree ...
breakout靶机
breakout:https://www.vulnhub.com/entry/empire-breakout,751/ 开机显示ip也可以不用扫描首先使用nmap扫描去访问网页使用dirb扫描这 ...
9.channels layers
settings.py配置 # 存储在内存里 CHANNEL_LAYERS = { "default": { "BACKEND": "channels ...
微服务 Zipkin 链路追踪原理(图文详解)
一个看起来很简单的应用,可能需要数十或数百个服务来支撑,一个请求就要多次服务调用. 当请求变慢.或者不能使用时,我们是不知道是哪个后台服务引起的. 这时,我们使用 Zipkin 就能解决这个问题. 由 ...

requests模块和openpyxl模块

第三方模块的下载和使用

网络爬虫模块之requests模块

网络爬虫实战之爬取链接数据

自动化办公领域之openpyxl模块

requests模块和openpyxl模块的更多相关文章

随机推荐

热门专题