【Python教程】用imap-tools模块下载邮件附件

零

5444
文章

46
评论

2021 年 12 月 10 日12:58:17Python教程评论200字数 2220阅读7分24秒阅读模式2021 年 12 月 10 日

所需工具：

Python

聪明的大脑文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

勤劳的双手文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

注意：本站只提供教程，不提供任何成品+工具+软件链接，仅限用于学习和研究，禁止商业用途。文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

环境: python3.8; imap-tools 0.39.0文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

需要pip 安装一下imap-tools模块文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

imap-tools模块是python的第三方扩展, 它使用标准库imaplib,并将常见的邮件处理事件封装,邮件处理起来代码短. 下面是个下载邮件附件的示例文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

[php]
from imap_tools import MailBox文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

with MailBox("imap服务器名").login("账号", "密码") as mailbox:
for msg in mailbox.fetch(limit=2,reverse=True): # 我这里为了避免读取全部的邮件,加上了limit=2的匹配参数,读取两封邮件,按照最新接收的次序排序,进行测试;
for att in msg.attachments: # msg为上一行取得的全部邮件
if att.filename: # 如果附件的文件名不为空
att_data = att.payload # 获得附件的内容
f = open(att.filename,'wb') # 用二进制打开,一般邮件附件都是二进制的.
f.write(att_data)
f.close()
[/php]文章源自灵鲨社区-https://www.0s52.com/bcjc/pythonjc/9708.html

就是这么短,用起来比imaplib爽多了.

补充：使用Python的imap和email模块读取邮件

SMTP发送邮件的博文很多，但完整读取邮件的较少，本文主要是Python3读取邮件的编码，同时使用BeautifulSoup解析邮件内容。

Python版本信息，如下：

Python 3.8.2 (tags/v3.8.2:7b3ab59, Feb 25 2020, 23:03:10) [MSC v.1916 64 bit (AMD64)] on win32

代码

[php]
import email
import imaplib
from bs4 import BeautifulSoup
def main():
try:
# 填写需要读取邮件服务器的imap的host和port，不知道请联系管理员
conn = imaplib.IMAP4_SSL(host='imap.xxx.com', port='993')
# 读取邮件的用户名和密码
conn.login('xxx@qq.com', 'your password')
# 默认选择收件箱 INBOX
conn.select()
# Recent\Seen参数不起作用，暂先读取所有邮件
status, data = conn.search(None, 'ALL')
if status != 'OK':
raise Exception('读取邮件发生错误')
emailids = data[0].split()
# 倒序读取邮件
mail_counts = len(emailids)
for i in range(mail_counts-1, 0, -1):
# 获取邮件信息
status, edata = conn.fetch(emailids[i], '(RFC822)')
# Message对象
msg = email.message_from_bytes(edata[0][1])
# 标题
subject = email.header.decode_header(msg.get('subject'))
# subject包含文档编码
default_code = subject[0][1]
# print('Content_Type', msg.get_content_type())
ctype = msg.get_content_type()
# 是否multipart类型，分别处理
if msg.is_multipart():
pl = msg.get_payload()
for m in pl:
ctype = m.get_content_type()
if 'html' in ctype:
# 注意decode参数，如果是True将解码base64/quoted-printable等格式编码内容，否则不解码
html = str(m.get_payload(decode=True), m.get('content-type').split('=')[1])
# BeautifulSoup解析<a title="网页" href="http://www.cppcns.com/web/" target="_blank" rel="noopener">网页
soup = BeautifulSoup(html, "lxml")
divs = soup.select('body')
for d in divs:
# 提取所有文本内容
text = d.get_text(strip=True)
print(text)
else:
html = str(msg.get_payload(decode=True), default_code)
# BeautifulSoup解析网页
soup = BeautifulSoup(html, "lxml")
# 提取body标签里面的所有文本内容
divs = soup.select('body')
for d in divs:
text = d.get_text(strip=True)
print(text)
except Exception as ex:
print(ex)
finally:
# close
conn.close()
conn.logout()
if __name__ == "__main__":
main()
[/php]

历史上的今天

12 月

2020【GG修改教程】修真传说秒升级+秒杀+无敌修改教程

【Python教程】用imap-tools模块下载邮件附件

所需工具：

历史上的今天

Python进阶技巧二三事（七）：字符串、python版本控制

python中的包管理器:pip使用小结

Python进阶技巧二三事（六）：字典解包与外键

python实现椭圆检测

计算机视觉的基础概念与入门

Python 性能分析的几个方法，找到你代码中的那个她

40个IPython的使用技巧整理

12种增强Python代码的函数式编程技术

Node、Python、Go中的websocket

探索LlamaIndex：如何用Django打造高效知识库检索

加载中...

发表评论

热门搜索

所需工具：

历史上的今天

发表评论