爬虫(十三):PIL模块
1. PIL模块
在爬虫(十二):图形验证码的识别、滑动验证码的识别(B站滑动验证码)中我留下了一个悬念,为什么安装的是pillow模块,而不是PIL模块。这是因为PIL是python2的产物,它并没有跟随python的发展而发展。所以有大佬为此特意写了一个针对python3的pillow模块。所以,如果需要安装python3对应的PIL,应该选择安装pillow。
1.1 导入Image模块
我们一般只使用PIL模块中的Image模块,所以我这就只讲解Image模块了。
安装PIL模块:
pip install pillow -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
导入模块:
from PIL import Image
1.2 Image模块常用方法
(1) 读取图片
open(url):读取一张图片,参数是图片名。
(2) 显示图片
show():显示一张图片。
案例:
from PIL import Image
img = Image.open('xhh.jpg')
img.show()
结果:

(3) 保存图片
save(image,type):将图像保存为名称为“image”、格式为type格式的图片。
(4) 创建新图片
new(mode,size):创建一张模式为mode、大小为size的图片。
new(mode,size,color):创建一张模式为mode、大小为size、颜色为color的图片。
案例:
from PIL import Image
newImg = Image.new("RGBA",(640,480),(255,0,0))
newImg.save("newImg.png","PNG")
结果:

(5) 两张图片相加
blend(img1,img2,alpha):将img1和img2,这里alpha表示img1和img2的比例参数
(6) 改变图像大小
resize(size):将图像修改为size大小
案例1:
from PIL import Image
img1 = Image.open("xhh.jpg")
img2 = Image.open("xhh2.jpg")
#img = img1×0.8+img2×0.2
img = Image.blend(img1,img2,0.2)
img.show()
结果:

为什么会报错呢?因为他们的大小不一样,而这个报错在官方是没有解释的。
案例2:
from PIL import Image
img1 = Image.open("xhh.jpg")
img1 = img1.resize((256,256))
img2 = Image.open("xhh2.jpg")
img2 = img2.resize((256,256))
#img = img1×0.7+img2×0.3
img = Image.blend(img1,img2,0.3)
img.show()
结果:

(7) 点操作
point(function):这个function接受一个参数,且对图片中的每一个点执行这个函数。
案例:
from PIL import Image
img = Image.open("xhh.jpg")
img.show()
out=img.point(lambda i:i*1.5)#对每个点进行50%的加强
out.show()

这前后对比明显吧。
(8) 查看图像信息
from PIL import Image
img = Image.open("xhh.jpg")
print(img.format)
print(img.size)
print(img.mode)
结果:

(9) 图片裁剪
crop(box):设置要裁剪的区域范围box。
案例:
from PIL import Image
img = Image.open("xhh.jpg")
box=(100,100,500,500)
#设置要裁剪的区域
region=img.crop(box) #此时,region是一个新的图像对象。
region.show()
结果:

(10) 图像黏贴(合并)
paste(region,box):黏贴box大小的region图像到原来的图片对象中。
案例:
from PIL import Image
img1 = Image.open("xhh.jpg")
img2 = Image.open("xhh2.jpg")
img1.paste(img2,(0,0))
img1.show()
结果:

(11) 通道分离
split():分割成三个通道,此时r,g,b分别为三个图像对象。
(12) 通道合并
merge("RGB",(b,g,r)):将b,r两个通道进行翻转。
案例:
from PIL import Image
img1 = Image.open("xhh.jpg")
img1.show()
r, g, b = img1.split()
img2 = Image.merge("RGB", (b, g, r))
img2.show()
结果:

(13) 旋转图像
rotate(angle):逆时针旋转angle度。
(14) 图像转换
案例:
from PIL import Image
img = Image.open("xhh.jpg")
#左右对换
out1 = img.transpose(Image.FLIP_LEFT_RIGHT)
out1.show()
#上下对换
out2 = img.transpose(Image.FLIP_TOP_BOTTOM)
out2.show()
结果:

(15) 图像类型转换
convert(mode):将图像转换成mode类型。
PIL的九种不同模式:1,L,P,RGB,RGBA,CMYK,YCbCr,I,F。
常用的两种:
1.模式”1”
为二值图像,非黑即白。但是它每个像素用8个bit表示,0表示黑,255表示白。下面我们将lena图像转换为“1”图像。
from PIL importImage
img = Image.open(“E:\image\myimg.jpg”)
img_1=img.convert(“1”)
2.模式“L”
为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。在PIL中,从模式“RGB”转换为“L”模式是按照下面的公式转换的:
L = R * 299/1000 + G * 587/1000+ B * 114/1000
(16) 获取某个像素位置的值
getpixel(coordinate):coordinate为(x,y)形式的值。
(17) 修改某个像素位置的值
putpixel(coordinate,color):修改像素位置coordinate的颜色color的值。
案例:
from PIL import Image
img = Image.open("xhh.jpg")
print(img.size)
print(img.getpixel((4, 4)))
width = img.size[0] # 长度
height = img.size[1] # 宽度
for w in range(0, width):
for h in range(0, height):
data = img.getpixel((w, h)) # 得到像素值
if (data[0] <= 170 and data[1] <= 170 and data[2] <= 170):
img.putpixel((w, h), (0, 0, 255)) # 则这些像素点的颜色改成大红色
img.show()
结果:

爬虫(十三):PIL模块的更多相关文章
- 爬虫四 selenium模块
一.介绍 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作, ...
- python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。
本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...
- Python爬虫之urllib模块2
Python爬虫之urllib模块2 本文来自网友投稿 作者:PG-55,一个待毕业待就业的二流大学生. 看了一下上一节的反馈,有些同学认为这个没什么意义,也有的同学觉得太简单,关于Beautiful ...
- Python爬虫之urllib模块1
Python爬虫之urllib模块1 本文来自网友投稿.作者PG,一个待毕业待就业二流大学生.玄魂工作室未对该文章内容做任何改变. 因为本人一直对推理悬疑比较感兴趣,所以这次爬取的网站也是平时看一些悬 ...
- asynicio模块以及爬虫应用asynicio模块(高性能爬虫)
一.背景知识 爬虫的本质就是一个socket客户端与服务端的通信过程,如果我们有多个url待爬取,只用一个线程且采用串行的方式执行,那只能等待爬取一个结束后才能继续下一个,效率会非常低. 需要强调的是 ...
- Python使用PIL模块生成随机验证码
PIL模块的安装 pip3 install pillow 生成随机验证码图片 import random from PIL import Image, ImageDraw, ImageFont fro ...
- 第三百二十六节,web爬虫,scrapy模块,解决重复ur——自动递归url
第三百二十六节,web爬虫,scrapy模块,解决重复url——自动递归url 一般抓取过的url不重复抓取,那么就需要记录url,判断当前URL如果在记录里说明已经抓取过了,如果不存在说明没抓取过 ...
- 第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签
第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签 标签选择器对象 HtmlXPathSelector()创建标签选择器对象,参数接收response回调的html对象需 ...
- 第三百二十四节,web爬虫,scrapy模块介绍与使用
第三百二十四节,web爬虫,scrapy模块介绍与使用 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中.其最初是为了 ...
随机推荐
- 使用BeautifulSoup爬取汽车之家新闻
1 先select到改数据上层的标签,取第一个[0],然后attrs获取单标签里面的内容,或者get_text获取成对标签内文本2 find就是明确了标签之后,是唯一的,就可以使用find(标签名). ...
- 只想remove parentNode的一部分children
parentNode.removeChildByTag(0); let childNode = new cc.Node(); parentNode.addChild(childNode); child ...
- Java-POJ1003-Hangover
题目大意: 给出一个浮点数a,求出使得 不等式 1/2 + 1/3 + ... + 1/(n+1) ≥ a 成立的最小值 大水题,由于数据范围小,给出了确认上界5.20,满足二分答案 但是我懒啊,直接 ...
- bzoj 1036: [ZJOI2008]树的统计Count (树链剖分)
ps:这道题过的人真多啊 一道树剖的模板题 (好像还可以用lct做, 然而我并不会 代码如下 /**************************************************** ...
- Spark 并行计算模型:RDD
Spark 允许用户为driver(或主节点)编写运行在计算集群上,并行处理数据的程序.在Spark中,它使用RDDs代表大型的数据集,RDDs是一组不可变的分布式的对象的集合,存储在executor ...
- 安装pecl
$ wget http://pear.php.net/go-pear.phar $ php go-pear.phar //php版本 < 7 $ yum install php-pear // ...
- Linux - cron - 基础
概述 cron 相关的理解与使用 背景 最近实在没啥写的了 我写东西, 一般是是这些 看了书过后, 做一些系统的整理 比如之前的 docker 和 git 系列 遇到了实际问题, 解决过程也不是那么顺 ...
- Iris请求方式和数据返回类型
1. Iris起服务 package main import "github.com/kataras/iris" func main() { //1.创建app结构体对象 app ...
- ansible笔记(1):ansible基本概念
一.基础概念 1.ansible是什么? ansible是一个配置管理工具,是一个自动化运维工具. 2.ansible能做什么? 它可以完成一组批量化的工作任务,或者经常重复性的工作任务.例如:a.在 ...
- IE的css hack
#element { color:orange; } #element { *color: white; } /* IE6+7, doesn’t work in IE8/9 as IE7 */ #el ...