gpt4 book ai didi

ruby-on-rails - NLP 和 Ruby 来表征写作质量

转载 作者:数据小太阳 更新时间:2023-10-29 08:54:26 24 4
gpt4 key购买 nike

我想尝试将我的应用程序中传入的文档描述为“写得好”或“写得不好”。我意识到这不是一件容易的事,但即使是一个粗略的想法也会很有用。我觉得这样做的方法是通过具有两个类的朴素贝叶斯分类器,但我愿意接受建议。所以两个问题:

  1. 此方法是执行此操作的最佳(考虑到简单性)方法吗假设训练数据库足够大?

  2. ruby 中有库吗 (或任何可集成的 JRuby 或 无论如何)我可以插入我的 Rails 应用程序可以毫不费力地实现这一目标?

谢谢!

最佳答案

您可以尝试使用词汇向量分析。在这里介绍了一些:

http://en.wikipedia.org/wiki/Semantic_similarity

基本上,您会建立一个您认为“写得好”或“写得不好”的文本语料库,并计算某些单词的出现频率。为每个向量创建一个归一化向量,然后计算它们与每个传入文档的向量之间的距离。我不是统计学家,但有人告诉我它类似于贝叶斯过滤,但似乎可以更好地处理拼写错误和异常值。

无论如何,这并不完美。根据您需要的准确度,您可能仍需要人工来做出最终判断。但我们很幸运地使用它作为预过滤器来减少审阅者的数量。

关于ruby-on-rails - NLP 和 Ruby 来表征写作质量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4995381/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com