作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试实现用于检测垃圾邮件的神经网络。我有用于解决 XOR 问题的神经网络,我想为我的目的编辑该网络并使用 ba。可在此处访问:https://github.com/trentsartain/Neural-Network
我下载了一些文本格式的垃圾邮件和非垃圾邮件数据库来训练网络。所以我有一些训练集。但我的问题是:
该神经网络的输入应该是什么?
感谢您的每一条评论! :)
最佳答案
简短的回答:输入将是您的垃圾邮件。
较长的答案,在非常基本的层面上:假设您的电子邮件没有奇怪的字符。想象一个向量,其中向量的每个元素代表这些电子邮件中出现的一个词。
对于每封电子邮件,您创建一个这样的向量,并为每个元素计算电子邮件中该词的频率。
所有这些向量,每封电子邮件一个,都将是您的输入。
这是基本的想法。然后你可以通过应用 stemming 来优化它, 使用 tf-idf而不是普通频率,引入其他输入元素(例如来自电子邮件标题)。
关于c# - 用于垃圾邮件检测的神经网络输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34665309/
我是一名优秀的程序员,十分优秀!