Python基础知识(35):电子邮件(Ⅱ)

收取邮件就是编写一个MUA作为客户端,从MDA把邮件获取到用户的电脑或者手机上

收取邮件最常用的协议是POP协议,目前版本号是3,俗称POP3

Python内置一个poplib模块,实现了POP3协议,可以直接用来收邮件

1、通过POP3协议下载邮件

获取最新的一封邮件内容

import poplib
from email.parser import Parser #输入邮件地址,口令和POP3服务器地址
email = input('Email: ')
password = input('Password: ')
pop3_server = input('POP3 server: ') #连接到POP3服务器
server = poplib.POP3(pop3_server)
#可以打开或关闭调试信息
server.set_debuglevel(1)
#可选:打印POP3服务器的欢迎文字
print(server.getwelcome().decode('utf-8')) #身份认证
server.user(email)
server.pass_(password) #start()返回邮件数量和占用空间
print('Messages: %s. Size: %s' % server.stat())
#list()返回所有邮件编号
resp, mails, octets = server.list()
#可以查看返回的列表类似[b'1 82923', b'2 2184', ...]
print(mails) #获取最新一封邮件,注意索引号从1开始
index = len(mails)
resp, lines, octets = server.retr(index) #lines存储了邮件的1原始文本的每一行
#可以获得整个邮件的原始文本
msg_content = b'\r\n'.join(lines).decode('utf-8')
#稍后解析出邮件
msg = Parser().parsestr(msg_content) #可以根据邮件索引号直接从服务器删除邮件
#server.dele(index) #关闭连接
server.close()

要获取所有邮件,只需要循环使用retr()把每一封邮件内容拿到即可。真正麻烦的是把邮件的原始内容解析为可以阅读的邮件对象

运行结果如下

Email: xxx@163.com
Password: xxxxx(这里填的是授权码)
POP3 server: pop.163.com
+OK Welcome to coremail Mail Pop3 Server (163coms[b62aaa251425b4be4eaec4ab4744cf47s])
*cmd* 'USER xxx@163.com'
*cmd* 'PASS xxxxx'
*cmd* 'STAT'
*stat* [b'+OK', b'', b'']
Messages: 1. Size: 2375
*cmd* 'LIST'
[b'1 2375']
*cmd* 'RETR 1'

2、解析邮件

解析邮件的过程和SMTP协议构造邮件正好相反,因此,先导入必要的模块

from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
import poplib

把邮件内容解析为Message对象

msg = Parser().parsestr(msg_content)

但是这个Message对象本身可能是一个MIMEMultipart对象,即包含嵌套的其他MIMEBase对象,嵌套可能还不止一层。

所以我们要递归地打印出Message对象的层次结构

#indent用于缩进显示
def print_info(msg, indent=0):
if indent == 0:
for header in ['From', 'To', 'Subject']:
value = msg.get(header, '')
if value:
if header == 'Subject':
value = decode_str(value)
else:
hdr, addr = parseaddr(value)
name = decode_str(hdr)
value = u'%s <%s>' % (name,addr)
print('%s%s: %s' % (' ' * indent, header, value))
if (msg.is_multipart()):
parts = msg.get_payload()
for n, part in enumerate(parts):
print('%spart %s' % (' ' * indent, n))
print('%s--------------------' % (' ' * indent))
print_info(part, indent+1)
else:
content_type = msg.get_content_type()
if content_type == 'text/plain' or content_type == 'text/html':
content = msg.get_payload(decode=True)
charset = guess_charset(msg)
if charset:
content = content.decode(charset)
print('%sText: %s' % (' ' * indent, content + '...'))
else:
print('%sAttachemnt: %s' % (' ' * indent, content_type))

邮件的Subject或者Email中包含的名字都是经过编码后的str,要正常显示,就必须decode

def decode_str(s):
value, charset = decode_header(s)[0]
if charset:
value = value.decode(charset)
return value

文本邮件的内容也是str,还需要检测编码,否则,非UTF-8编码的邮件都无法正常显示

def guess_charset(msg):
charset = msg.get_charset()
if charset is None:
content_type = msg.get('Cnotne-Type', '').lower()
pos = content_type.find('charset=')
if pos >= 0:
charset = content_type[pos + 8:].strip()
return charset

完整代码如下:

from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
import poplib #输入邮件地址,口令和POP3服务器地址
email = input('Email: ')
password = input('Password: ')
pop3_server = input('POP3 server: ') def decode_str(s):
value, charset = decode_header(s)[0]
if charset:
value = value.decode(charset)
return value def guess_charset(msg):
charset = msg.get_charset()
if charset is None:
content_type = msg.get('Content-Type', '').lower()
pos = content_type.find('charset=')
if pos >= 0:
charset = content_type[pos + 8:].strip()
return charset # indent用于缩进显示:
def print_info(msg, indent=0):
if indent == 0:
for header in ['From', 'To', 'Subject']:
value = msg.get(header, '')
if value:
if header=='Subject':
value = decode_str(value)
else:
hdr, addr = parseaddr(value)
name = decode_str(hdr)
value = u'%s <%s>' % (name, addr)
print('%s%s: %s' % (' ' * indent, header, value))
if (msg.is_multipart()):
parts = msg.get_payload()
for n, part in enumerate(parts):
print('%spart %s' % (' ' * indent, n))
print('%s--------------------' % (' ' * indent))
print_info(part, indent + 1)
else:
content_type = msg.get_content_type()
if content_type=='text/plain' or content_type=='text/html':
content = msg.get_payload(decode=True)
charset = guess_charset(msg)
if charset:
content = content.decode(charset)
print('%sText: %s' % (' ' * indent, content + '...'))
else:
print('%sAttachment: %s' % (' ' * indent, content_type)) #连接到POP3服务器
server = poplib.POP3(pop3_server)
#可以打开或关闭调试信息
server.set_debuglevel(1)
#可选:打印POP3服务器的欢迎文字
print(server.getwelcome().decode('utf-8')) #身份认证
server.user(email)
server.pass_(password) #start()返回邮件数量和占用空间
print('Messages: %s. Size: %s' % server.stat())
#list()返回所有邮件编号
resp, mails, octets = server.list()
#可以查看返回的列表类似[b'1 82923', b'2 2184', ...]
print(mails) #获取最新一封邮件,注意索引号从1开始
index = len(mails)
resp, lines, octets = server.retr(index) #lines存储了邮件的1原始文本的每一行
#可以获得整个邮件的原始文本
msg_content = b'\r\n'.join(lines).decode('utf-8')
#稍后解析出邮件
msg = Parser().parsestr(msg_content)
print_info(msg) #关闭连接
server.close()

运行结果如下:

Email: xxx@163.com
Password: xxxxx
POP3 server: pop.163.com
+OK Welcome to coremail Mail Pop3 Server (163coms[b62aaa251425b4be4eaec4ab4744cf47s])
*cmd* 'USER xxx@163.com'
*cmd* 'PASS xxxxx'
*cmd* 'STAT'
*stat* [b'+OK', b'', b'']
Messages: 1. Size: 2375
*cmd* 'LIST'
[b'1 2375']
*cmd* 'RETR 1'
From: xxxx<xxxx@qq.com>
To: xxx <xxx@163.com>
Subject: Hello, world!
part 0
--------------------
Text: ...
part 1
--------------------
Text: <div><br></div><div> </div>...

资料来源:

1、廖雪峰学习官网

2、kornberg_fresnel的博文:https://blog.csdn.net/kornberg_fresnel/article/details/51227761

Python学习之旅(三十六)的更多相关文章

  1. python学习之旅(十六)

    Python基础知识(15):模块 1.可以把模块想象成导入Python以增强其功能的扩展 2.任何程序都可以作为模块导入 3.导入模块并不意味着在导入的时候执行某些操作,它们主要用于定义变量.函数和 ...

  2. Python之路(第三十六篇)并发编程:进程、同步异步、阻塞非阻塞

    一.理论基础 进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重要的抽象概念之一.操作系统的其他所有内容都是围绕进程的概念展开的. 即使可以利用的cpu只有一个(早期的 ...

  3. Python学习之旅(十二)

    Python基础知识(11):高级特性 一.分片(切片) 通过索引来获取一定范围内的元素 #字符串 s="Alice" s[0:4:2] 结果: 'Ai' #列表 l=[1,2,3 ...

  4. python接口自动化(三十六)-封装与调用--流程类接口关联续集(详解)

    简介 上一篇已经给大家都介绍过了流程类接口关联,但是由于博客的登录机制改变,所以没有办法给小伙伴们实战演练一下,那么这篇就按照上一篇计划的用jenkins来给小伙伴们演示一下流程类接口的封装和调用,其 ...

  5. 流畅python学习笔记:第十六章:协程

    通常在python进行编程一般都是使用多线程或者多进程来实现.这里介绍另外一种并发的方式,就是协程,但和多线程以及多进程不一样的是,协程是运行在单线程当中的并发.来看下具体的例子: def simpl ...

  6. 【WPF学习】第三十六章 样式基础

    前面三章介绍了WPF资源系统,使用资源可在一个地方定义对象而在整个标记中重用他们.尽管可使用资源存储各种对象,但使用资源最常见的原因之一是通过他们的保存样式. 样式是可应用于元素的属性值集合.WPF样 ...

  7. [转] Linux学习之CentOS(三十六)--FTP服务原理及vsfptd的安装、配置

    本篇随笔将讲解FTP服务的原理以及vsfptd这个最常用的FTP服务程序的安装与配置... 一.FTP服务原理 FTP(File Transfer Protocol)是一个非常古老并且应用十分广泛的文 ...

  8. [ExtJS5学习笔记]第三十六节 报表组件mzPivotGrid

    mzPivotGrid 是一个报表组件,采用这个组件之后,可以令你的应用体现更多的价值. 什么是pivot grid 什么是mzPivotGrid 学习资源 与图表组件的融合 什么是pivot gri ...

  9. Python学习之旅(十九)

    Python基础知识(18):面向对象高级编程(Ⅰ) 使用__slots__:限制实例的属性,只允许实例对类添加某些属性 (1)实例可以随意添加属性 (2)某个实例绑定的方法对另一个实例不起作用 (3 ...

  10. Python学习之旅(十八)

    Python基础知识(17):面向对象编程(Ⅱ) 获取对象信息 在不知道对象信息的情况下,我们想要去获取对象信息,可以使用以下方法 1.type (1)判断对象类型 >>> type ...

随机推荐

  1. Teigha.NET开发入门1- Teigha介绍

    对于CAD开发,无疑较强大的方式是Lisp.AutoCAD二次开发,且学习资源丰富,依靠强大的AutoCAD的环境可以干很多事,省很多力.但若要脱离AutoCAD环境,那就当属Teigha了. 名称问 ...

  2. edis更新的正确方法

    Redis更新的正确方法 https://www.cnblogs.com/westboy/p/8696607.html redis做缓存,怎么更新里面的数据 https://blog.csdn.net ...

  3. python接口自动化测试(三)-requests.post()

    上一节介绍了  requests.get()  方法的基本使用,本节介绍  requests.post()  方法的使用: 本文目录: 一.方法定义 二.post方法简单使用 1.带数据的post 2 ...

  4. VS2015 ionic 开发环境配置纪要

    1)第一次安装Tools for Apache Cordova不成功,到Options检查依赖项,缺少Node等,重新下载了32为的nodeJs安装.然后运行VS安装程序,卸载Tools for Ap ...

  5. mysql官方驱动jar

    问题描述: 在mysql5.7版本,发现登录不了,找不到原因.有人说是驱动的问题,下载最新的驱动,问题得到解决! 问题解决: 下载最新mysql-jar驱动,传统版本最新mysql-jar驱动版本5. ...

  6. Effective Java 第三版——82. 线程安全文档化

    Tips 书中的源代码地址:https://github.com/jbloch/effective-java-3e-source-code 注意,书中的有些代码里方法是基于Java 9 API中的,所 ...

  7. There is a chart instance already initialized on the dom!警告

    使用Echarts插件的时候,多次加载会出现There is a chart instance already initialized on the dom.这个错误,改插件已经加载完成. 并且如果你 ...

  8. Atitit s2018.6 s6 doc list on com pc.docx Atitit s2018.6 s6 doc list on com pc.docx  Aitit algo fix 算法系列补充.docx Atiitt 兼容性提示的艺术 attilax总结.docx Atitit 应用程序容器化总结 v2 s66.docx Atitit file cms api

    Atitit s2018.6 s6  doc list on com pc.docx Atitit s2018.6 s6  doc list on com pc.docx  Aitit algo fi ...

  9. go mod代理和小技巧

    代理 go mod的代理比较出名的有微软的athens,可以基于它搭建一个私有的代理,管理内部的私有代码,而且微软提供了一个公共的代理,我们可以直接使用 Linux export GOPROXY=&q ...

  10. Linux配置定时,使用 crontab -e 与 直接编辑 /etc/crontab 的区别

    转自:http://blog.csdn.net/catoop/article/details/41821395 版权声明:本文为博主原创文章,未经博主允许不得转载. Linux配置定时任务,大家都知道 ...