gpt4 book ai didi

php - 如何在文本中找到任何单词但在标签内区分?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:44:56 26 4
gpt4 key购买 nike

我想在文本中找到最小长度 (eq 4) 的任何单词,它也可以在 <strong> 等标签之间找到或 <h1>等等。之后我想对这些词进行加权。普通单词的得分低于 <strong> 之间的单词。 .但是这些词不应该单独出现在更具得分性的标签中(如强)。

示例内容

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor
invidunt ut labore et dolore <strong>magna aliquyam erat</strong>, sed diam voluptua.
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor
invidunt ut labore et dolore <strong>magna</strong> aliquyam erat, sed diam voluptua

我可以用 regexp 来做这件事吗,比如找到任何单词并检查 preg 回调中它们是否在标签内,或者这怎么可能?

非常感谢!

最佳答案

(?<=\/|<)(\w{4,})(?=>)|\b(\w{4,})

您可以试试这个。匹配的第 1 部分 将始终来自标签。匹配的第 2 部分 将是其他正常单词。

查看演示。

http://regex101.com/r/hQ1rP0/74

关于php - 如何在文本中找到任何单词但在标签内区分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26254890/

26 4 0