我在尝试在 python 中提取所有电子邮件标头时遇到了一些问题.我知道如何获取我正在寻找的那些,但我想保存所有标题,但我不知道该怎么做.
I'm having some issues trying to extract all the email headers in python. I know how to get the ones I'm looking for but I want to save all the headers and I'm not sure how to do that.
我已将其加载到电子邮件对象中
I have it loaded into a email object
import email
f = open(kwargs['opt_emailfile'])
msg = email.message_from_file(f)
f.close()
所以我可以得到
msg['To']
msg['From']
但我想要所有的标题
解决方案
感谢回答,这是我所做的
Here is what I did thanks to the answer
f = open(kwargs['opt_emailfile'])
msg = email.message_from_file(f)
f.close()
parser = email.parser.HeaderParser()
headers = parser.parsestr(msg.as_string())
for h in headers.items():
print h
使用 HeaderParser 或许:
from email.parser import HeaderParser
parser = HeaderParser()
h = parser.parsestr(email)
print h.keys()
我刚刚注意到您编辑了您的问题.您实际上可以在不使用 HeaderParser 的情况下从您所拥有的信息中获得相同的信息.例如headers.items() 将返回带有标题和相应值的 2 元组列表.
I just noticed you edited your question. You can actually get the same information from what you had without using HeaderParser. e.g. headers.items() will return list of 2-tuples with headers and corresponding values.
这篇关于在 python 中仅提取电子邮件标头的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持html5模板网!
如何在 Python 中将货币字符串转换为浮点数?How do I convert a currency string to a floating point number in Python?(如何在 Python 中将货币字符串转换为浮点数?)
在 Pandas 中解析多索引 Excel 文件Parsing a Multi-Index Excel File in Pandas(在 Pandas 中解析多索引 Excel 文件)
pandas 时间序列 between_datetime 函数?pandas timeseries between_datetime function?( pandas 时间序列 between_datetime 函数?)
pandas 重新采样到每月的特定工作日pandas resample to specific weekday in month( pandas 重新采样到每月的特定工作日)
Python - 如何标准化时间序列数据Python - how to normalize time-series data(Python - 如何标准化时间序列数据)
statsmodels 使用 ARMA 模型进行预测statsmodels forecasting using ARMA model(statsmodels 使用 ARMA 模型进行预测)