gpt4 book ai didi

php - 用下划线将句子中的否定句与后面的词联系起来

转载 作者:搜寻专家 更新时间:2023-10-31 21:16:20 25 4
gpt4 key购买 nike

我正在尝试计算网站上正面评价的数量。考虑以下字符串:

$str_1 = "This is great";
$str_2 = "This is not great after all";
$str_3 = "That isn't good and I will not return to this store.";

他们的意思相反。在自动分类中,$str_2 和 3 会被大多数分类器(只计算句子中正词的数量)计为正数。我想通过将“not”与“great”、“isn't”与“good”和“not”与“return”联系起来来避免这个错误,如下所示:

$str_1 = "This is great";
$str_2 = "This is not_great after all";
$str_3 = "That isn't_good and I will not_return to this store.";

我首先对字符串进行标记:

$tokens = explode("", $str_3);

但我不知道如何进行。如何将否定词(“not”、“isn't”)之后的词与后面的词联系起来?在这里使用正则表达式不是更好吗?

最佳答案

我不确定这个答案是否会有很大帮助,恐怕......如果你真的想对论坛上的帖子的情绪进行分类,这是一个非常困难的问题。您提出的建议将使您有所收获,但是英语(和其他语言)的复杂性要高得多,因此没有考虑在内。例如:

  • 我不是在开玩笑:这个产品很烂
  • 我怎么推荐这个产品都不为过
  • 我不能推荐这个产品

等换句话说,在一些简单的情况下,寻找一个以否定开头的肯定词是可行的,但在很多其他情况下则行不通。我想你会想要一个更复杂的方法。如果您有大量训练数据(即手动分类评论),您可以使用神经网络或分类器,如 SVM 或朴素贝叶斯分类器。

我怀疑如果您继续使用正则表达式方法,您会发现您将永远添加异常和特殊情况,并且它最终会变得异常复杂并且只能在 50% 的情况下工作。抱歉,我不能更积极了!

关于php - 用下划线将句子中的否定句与后面的词联系起来,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7908297/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com