gpt4 book ai didi

python - 对电子邮件的优先级列表进行排名

转载 作者:太空宇宙 更新时间:2023-11-04 10:49:52 25 4
gpt4 key购买 nike

我正在尝试用 Python 制作一个简单的电子邮件排名程序(类似于优先收件箱)。基于从发件人那里收到电子邮件的频率,例如有一个训练集,比如 50%,其中计算发件人的频率,然后是一个 50% 的测试集,它根据训练按顺序排列(所以一封电子邮件来自发送大量消息的发件人排名靠前)。

我已经编写了一些 Python 代码来接收电子邮件并从每个电子邮件中提取“发件人”地址。我已将这些信息放在一个列表中,该列表显示了最常见的电子邮件发件人(下面列表中的示例片段)。

 //(Email address, frequency of emails received from this sender)//Not Code
('tester1@csmining.org', 244)
('tester2@csmining.org', 162)
('tester3@csmining.org', 154)
('tester4@csmining.org', 75)
('tester5@csmining.org', 50)

我知道可以有效地使用许多机器学习算法来训练和测试我的数据以完成我需要的操作。但是,我不确定我可以使用其中哪些来获得最佳结果?

最佳答案

仅根据发件人进行排名绝不是一个好主意。对于我自己,我订阅了来自 github commit 的电子邮件通知。由于我同事的代码提交,我每天都会收到数百封电子邮件。

这从来都不是一个简单的问题,根据我的经验,即使是 Gmail 优先收件箱也做得不好。一个好的电子邮件优先级排名或评分系统需要好的功能。我会建议从以下功能开始。参见 The Learning Behind Gmail Priority Inbox :

  • 社交功能。发件人或发件人域;
  • 线程功能。这封电子邮件是否在事件线程中?这封电子邮件在线程中的序号是多少?如果有的话,抄送的用户是谁?
  • 时间特征。这封邮件是什么时候收到的?如果您有权访问所有者的回复,您可能希望跟踪所有者回复所需的时间。
  • 内容特征。这是垃圾邮件过滤中使用的词袋模型。
  • 行为。这是电子邮件帐户所有者对电子邮件的回复方式。回复了吗或者从未读过?还是立即删除?或存档到不同的文件夹?标记?如果收到回复,您可能还需要进行一些内容分析。回复的长度也可能是一个很好的功能。

对于回归模型,Gmail 使用线性逻辑回归来保持学习和预测的可扩展性。

最后,与 Gmail 一样,您可以让用户选择标记重要电子邮件,从而帮助您改进系统。

进一步阅读:

关于python - 对电子邮件的优先级列表进行排名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14632624/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com