爬虫(十三):PIL模块
1. PIL模块
在爬虫(十二):图形验证码的识别、滑动验证码的识别(B站滑动验证码)中我留下了一个悬念,为什么安装的是pillow模块,而不是PIL模块。这是因为PIL是python2的产物,它并没有跟随python的发展而发展。所以有大佬为此特意写了一个针对python3的pillow模块。所以,如果需要安装python3对应的PIL,应该选择安装pillow。
1.1 导入Image模块
我们一般只使用PIL模块中的Image模块,所以我这就只讲解Image模块了。
安装PIL模块:
pip install pillow -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
导入模块:
from PIL import Image
1.2 Image模块常用方法
(1) 读取图片
open(url):读取一张图片,参数是图片名。
(2) 显示图片
show():显示一张图片。
案例:
from PIL import Image
img = Image.open('xhh.jpg')
img.show()
结果:

(3) 保存图片
save(image,type):将图像保存为名称为“image”、格式为type格式的图片。
(4) 创建新图片
new(mode,size):创建一张模式为mode、大小为size的图片。
new(mode,size,color):创建一张模式为mode、大小为size、颜色为color的图片。
案例:
from PIL import Image
newImg = Image.new("RGBA",(640,480),(255,0,0))
newImg.save("newImg.png","PNG")
结果:

(5) 两张图片相加
blend(img1,img2,alpha):将img1和img2,这里alpha表示img1和img2的比例参数
(6) 改变图像大小
resize(size):将图像修改为size大小
案例1:
from PIL import Image
img1 = Image.open("xhh.jpg")
img2 = Image.open("xhh2.jpg")
#img = img1×0.8+img2×0.2
img = Image.blend(img1,img2,0.2)
img.show()
结果:

为什么会报错呢?因为他们的大小不一样,而这个报错在官方是没有解释的。
案例2:
from PIL import Image
img1 = Image.open("xhh.jpg")
img1 = img1.resize((256,256))
img2 = Image.open("xhh2.jpg")
img2 = img2.resize((256,256))
#img = img1×0.7+img2×0.3
img = Image.blend(img1,img2,0.3)
img.show()
结果:

(7) 点操作
point(function):这个function接受一个参数,且对图片中的每一个点执行这个函数。
案例:
from PIL import Image
img = Image.open("xhh.jpg")
img.show()
out=img.point(lambda i:i*1.5)#对每个点进行50%的加强
out.show()

这前后对比明显吧。
(8) 查看图像信息
from PIL import Image
img = Image.open("xhh.jpg")
print(img.format)
print(img.size)
print(img.mode)
结果:

(9) 图片裁剪
crop(box):设置要裁剪的区域范围box。
案例:
from PIL import Image
img = Image.open("xhh.jpg")
box=(100,100,500,500)
#设置要裁剪的区域
region=img.crop(box) #此时,region是一个新的图像对象。
region.show()
结果:

(10) 图像黏贴(合并)
paste(region,box):黏贴box大小的region图像到原来的图片对象中。
案例:
from PIL import Image
img1 = Image.open("xhh.jpg")
img2 = Image.open("xhh2.jpg")
img1.paste(img2,(0,0))
img1.show()
结果:

(11) 通道分离
split():分割成三个通道,此时r,g,b分别为三个图像对象。
(12) 通道合并
merge("RGB",(b,g,r)):将b,r两个通道进行翻转。
案例:
from PIL import Image
img1 = Image.open("xhh.jpg")
img1.show()
r, g, b = img1.split()
img2 = Image.merge("RGB", (b, g, r))
img2.show()
结果:

(13) 旋转图像
rotate(angle):逆时针旋转angle度。
(14) 图像转换
案例:
from PIL import Image
img = Image.open("xhh.jpg")
#左右对换
out1 = img.transpose(Image.FLIP_LEFT_RIGHT)
out1.show()
#上下对换
out2 = img.transpose(Image.FLIP_TOP_BOTTOM)
out2.show()
结果:

(15) 图像类型转换
convert(mode):将图像转换成mode类型。
PIL的九种不同模式:1,L,P,RGB,RGBA,CMYK,YCbCr,I,F。
常用的两种:
1.模式”1”
为二值图像,非黑即白。但是它每个像素用8个bit表示,0表示黑,255表示白。下面我们将lena图像转换为“1”图像。
from PIL importImage
img = Image.open(“E:\image\myimg.jpg”)
img_1=img.convert(“1”)
2.模式“L”
为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。在PIL中,从模式“RGB”转换为“L”模式是按照下面的公式转换的:
L = R * 299/1000 + G * 587/1000+ B * 114/1000
(16) 获取某个像素位置的值
getpixel(coordinate):coordinate为(x,y)形式的值。
(17) 修改某个像素位置的值
putpixel(coordinate,color):修改像素位置coordinate的颜色color的值。
案例:
from PIL import Image
img = Image.open("xhh.jpg")
print(img.size)
print(img.getpixel((4, 4)))
width = img.size[0] # 长度
height = img.size[1] # 宽度
for w in range(0, width):
for h in range(0, height):
data = img.getpixel((w, h)) # 得到像素值
if (data[0] <= 170 and data[1] <= 170 and data[2] <= 170):
img.putpixel((w, h), (0, 0, 255)) # 则这些像素点的颜色改成大红色
img.show()
结果:

爬虫(十三):PIL模块的更多相关文章
- 爬虫四 selenium模块
一.介绍 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作, ...
- python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。
本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...
- Python爬虫之urllib模块2
Python爬虫之urllib模块2 本文来自网友投稿 作者:PG-55,一个待毕业待就业的二流大学生. 看了一下上一节的反馈,有些同学认为这个没什么意义,也有的同学觉得太简单,关于Beautiful ...
- Python爬虫之urllib模块1
Python爬虫之urllib模块1 本文来自网友投稿.作者PG,一个待毕业待就业二流大学生.玄魂工作室未对该文章内容做任何改变. 因为本人一直对推理悬疑比较感兴趣,所以这次爬取的网站也是平时看一些悬 ...
- asynicio模块以及爬虫应用asynicio模块(高性能爬虫)
一.背景知识 爬虫的本质就是一个socket客户端与服务端的通信过程,如果我们有多个url待爬取,只用一个线程且采用串行的方式执行,那只能等待爬取一个结束后才能继续下一个,效率会非常低. 需要强调的是 ...
- Python使用PIL模块生成随机验证码
PIL模块的安装 pip3 install pillow 生成随机验证码图片 import random from PIL import Image, ImageDraw, ImageFont fro ...
- 第三百二十六节,web爬虫,scrapy模块,解决重复ur——自动递归url
第三百二十六节,web爬虫,scrapy模块,解决重复url——自动递归url 一般抓取过的url不重复抓取,那么就需要记录url,判断当前URL如果在记录里说明已经抓取过了,如果不存在说明没抓取过 ...
- 第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签
第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签 标签选择器对象 HtmlXPathSelector()创建标签选择器对象,参数接收response回调的html对象需 ...
- 第三百二十四节,web爬虫,scrapy模块介绍与使用
第三百二十四节,web爬虫,scrapy模块介绍与使用 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中.其最初是为了 ...
随机推荐
- layui之laydate
.点击年份马上关闭窗口并且赋值 html代码: <div class="layui-form-item"> <label class="layui-fo ...
- 第三十五篇 入门机器学习——Juptyer Notebook中的常用快捷键
1.运行当前Cell:Ctrl + Enter 2.运行当前Cell并在其下方插入一个新的Cell:Alt + Enter 3.运行当前Cell并选中其下方的Cell:Shift + ...
- clippingNode 裁剪
let stencil = new cc.Sprite(fileName); let clippingNode = new cc.ClippingNode();this.addChild(clippi ...
- Java的多态-进阶
Java的多态——进阶 总括 Parent p = new Child(); 反之,Child() c = new Parent(); 会报错. 当使用多态方式调用方法时,首先检查父类中是否有该方法. ...
- Django_连接MySQL
1. 在Settings中修改 2. 创建数据库 3. 连接mysql 4. pymysql 4.1 安装pymysql 在项目的init文件中添加 Django2.2 不需要伪装
- LED Decorative Light Manufacturer - Decorative Lighting: Functionality And Aesthetics
Whether it is for general ambient lighting, task lighting or accent lighting, the decorative lightin ...
- argument
js中arguments的用法 了解arguments这个对象之前先来认识一下javascript的一些功能: 其实Javascript并没有重载函数的功能,但是Arguments对象能够模拟重载 ...
- Bug搬运工-Forerunner CRC error on 54SG/53SG3 triggers watchdog timeout crash
这个bug,一般是设备4948 Crash的情况: 标志1:Error Message C4K_SUPERVISOR-2-SOFTERROR: memory inconsistency detecte ...
- ALSA driver--HW Buffer
当app在调用snd_pcm_writei时,alsa core将app传来的数据搬到HW buffer(即DMA buffer)中,alsa driver从HW buffer中读取数据传输到硬件播放 ...
- 一些 乱码 GPU的问题
# # s = '网站地图' 原始 # s1 = s.encode('utf-8') # print(s1.decode('gbk')) #res 缃戠珯鍦板浘 # s = '缃戠珯鍦板浘' 原始 # ...