php - 当 haystack 包含额外标记时，文本解析器会在 needle 上给出假阴性-6ren

php - 当 haystack 包含额外标记时，文本解析器会在 needle 上给出假阴性

转载作者：搜寻专家更新时间：2023-10-31 21:44:42

25

4

下面的代码采用一个关键字和一串文本(经过 html 标记清理)，并确定该关键字是否出现在经过清理的内容的最后一句话中。

有一个小故障我想不通。当内容末尾包含一个空格或带有不间断空格的段落标签时，即

This is the last sentence.<p>&nbsp;</p>

我得到了假阴性(不匹配)，尽管事实上 (1) 关键字肯定在最后一句话中，并且 (2) strip_tags() 函数应该在最后呈现标签的外观不是问题.

有人知道为什么会这样吗？

function plugin_get_kw_last_sentence($post) {
    $theContent = strip_tags(strtolower($post->post_content));
    $theKeyword = 'test';
    $thePiecesByKeyword = plugin_get_chunk_keyword($theKeyword,$theContent);
    if (count($thePiecesByKeyword)>0) {
        $theCount = $thePiecesByKeyword[count($thePiecesByKeyword)-1];
        $theCount = trim($theCount,'.');
        if (substr_count($theCount,'.')>0) {
            return FALSE;
        } else {
            return TRUE;
        }
    }
    return FALSE;
}

function plugin_get_chunk_keyword($theKeyword, $theContent) {
    if (!plugin_get_kw_in_content($theKeyword,$theContent)) {
        return array();
    }

    $myPieceReturn = preg_split('/\b' . $theKeyword . '\b/i', $theContent);
    return $myPieceReturn;
}

最佳答案

如果我正确理解您的逻辑，我认为可以仅在正则表达式中涵盖您那里发生的很多事情。整个逻辑不能简化为:

function plugin_get_kw_last_sentence($post) {
    $pattern = '/' . $theKeyword . '[^.!?]*[.!?][^.!?]*$/';
    $subject = strip_tags(strtolower($post->post_content));
    return preg_match($pattern, $subject);
}

正则表达式在找到您的关键字和最后一个句子结尾标点符号且它们之间没有其他句子结尾标点符号时匹配。

现在这显然不是防弹的，因为诸如头衔(即先生、夫人)等...以及包括这些句末标点符号在内的任何其他内容都会让您失望。这应该可以满足您的要求，因为您给定的代码也没有考虑到这些情况。

关于php - 当 haystack 包含额外标记时，文本解析器会在 needle 上给出假阴性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5799263/

25

4

0

文章推荐： php - RewriteURL 问题 - PHP

文章推荐： php - 来自 Graph API 的聊天消息？

文章推荐： php - 使用 Bitly API 缩短 URL

文章推荐： php - Comet 软件相对于标准长轮询的优势

C: 当 Haystack 中找不到 Needle 时，my_strstr 返回 Needle
我的第一个堆栈溢出问题，所以我希望它格式正确。我制作了一个模拟 strstr 的简单函数: char *my_strstr(char *haystack, char *needle) { in
mysql - Solr字段:needle or q=needle&qf=field different results
假设我正在尝试在任何领域搜索“Douglas”。如果我这样做: solr/query?q=Douglas 我收到 0 条回复，但如果我这样做: solr/query?q=firstname:Dougl
php - 匹配包含两个 "needles"的字符串
我有一个字符串，看起来有点像这样 1: u:mads g:folk 2: g:andre u:jens u:joren 我需要的是一种获取例如 u:jens 和它后面的数字(1 或 2)的方法(我猜测
java - 安卓 :How to animate the speedometer needle
我通过引用以下链接中的代码在我的项目中实现了速度计。我需要对速度计指针进行动画处理，直到从服务器获得结果，一旦获得结果，我需要根据一些计算将指针设置为正确的值。我不明白该怎么做。请帮我解决问题。
C++ - Haystack/Needle 字符串检查总是返回 false
我写了一个小方法来查看一个字符串是否包含另一个字符串。不过我只有一个小问题，它总是返回 false。给定大海捞针是一个名为 salaryCheck 的字符串，其值为“10.1”，针是“.”。它总是返
string - 在二维 "needle"中搜索 "haystack"
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
php - 如何在数组 php 中找到最后一次出现的 "needle"
有一个内置函数用于查找值的数组键 - array_search .然而，正如您从示例中看到的那样，该函数仅查找第一次出现的情况，而我需要最后一次出现: 'blue', 1 => 'red', 2 =
PHP, 'Haystack contains Needle?'
假设这可以正确判断子字符串是否在字符串中，是否有更简洁的方法来做到这一点？ if(is_int(strpos($haystack, $needle))){ ... } 最佳答案我不会那样做的。
javascript - PHP警告: stristr(): Empty needle in line
我从以下代码中得到了一个奇怪的行为..它的目的是在每次按键时为用户提供自动完成选项 function autoComplete(str) { debugger; if (str
php - in_array、needle 和 haystack 都是数组
是否有一个函数可以检查数组中的某些值？我有 2 个数组，1 个带有文件扩展名，1 个带有混合内容。 In_array 仅适用于字符串。谢谢了! 文件示例: picture21474.png 允许的扩
php - in_array, needle 和 haystack 都是一个数组
是否有检查数组中某些值的函数？我有 2 个数组，1 个带有文件扩展名，1 个带有混合内容。 In_array 仅处理字符串。已经谢谢了! 文件示例: picture21474.png 允许的扩展名:
python - [Python+ Bokeh ] : how to make a needle dial?
我需要一个针盘，显示实时值。该值改变针的角度，而不是位置。到目前为止，我所能做的就是使用 ray() 或 annular_wedge() 字形，但是这个解决方案有很多问题:前面的行不是删除，几次更新
html - CSS : Change angle of rotation of needle
我有一张图片。在该图像上，我放置了一个针图像，我想将其旋转一定 Angular 。一切都运行良好。我想要的是改变针的 0 度位置。目前它在顶部，我想在底部制作 0 度点。请参阅下面的附图。这是我为此
node.js - 在流模式下使用 needle.js 时如何获取响应 header ？
我想在流模式下使用 node.js 的 needle 模块，类似于 needle 文档中的这个例子: var stream = needle.get('http://www.as35662.net/1
java - 在这段代码中，我将如何以及在哪里为我的 Needle 和 haystacks 变量获取用户输入
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
c - strstr() - C 库函数在字符串 (haystack) 中找不到字符串 (needle)
我有以下代码，它从命令行获取参数并大海捞针。 #include #include int main(int argc, char **argv) { int i, j, flag = 0;
node.js - 使用node.js、needle、busboy/multer将文件从一台服务器发送到另一台服务器
我想将一个小图像从一台服务器移动到另一台服务器(都运行 Node )。当我搜索时，我还没有找到足够的东西。 This该帖子仍未得到答复。当我开始试验时，我向第一台服务器写入了以下内容: app.po
node.js - 是否可以通过另一个 IP 向 Needle 模块发送请求？
请求模块有参数localAddress。 options = { url: "https://ru.tradeskinsfast.com/ajax/botsinventory",
php - 警告 : strpos(): Empty needle in . .....wordpress 插件
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
php - 当 haystack 包含额外标记时，文本解析器会在 needle 上给出假阴性
下面的代码采用一个关键字和一串文本(经过 html 标记清理)，并确定该关键字是否出现在经过清理的内容的最后一句话中。有一个小故障我想不通。当内容末尾包含一个空格或带有不间断空格的段落标签时，即 T

首页

博学

6Ren·AI

商城

php - 当 haystack 包含额外标记时，文本解析器会在 needle 上给出假阴性