gpt4 book ai didi

php - 避免匹配具有不同含义的流行词的词干

转载 作者:行者123 更新时间:2023-12-04 05:16:35 24 4
gpt4 key购买 nike

就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the help center为指导。




8年前关闭。




我目前正在使用 PorterStemmer 来识别派生词。但是,我遇到了一个问题,这些词的含义不同但似乎具有相同的含义。例如:MarketMarketingWineWinning等..
有不同的含义,但 PorterStemmer 将它们标识为相同的。

哪些开放工具能够克服这些问题?一本带有极端情况的字典?更高级的词干分析器?

最好是可以通过 PHP 轻松访问的东西。

最佳答案

这是词干分析器的一个已知问题,因为它们在没有任何语言知识的情况下在语音基础上运行。你需要一个词形还原器。我主要使用 Java-based Stanford CoreNLP ,但我确信 PHP 中肯定有一些东西。

关于php - 避免匹配具有不同含义的流行词的词干,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14192152/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com