php - 拼图 : Splitting An HTML String Correctly-6ren

php - 拼图 : Splitting An HTML String Correctly

转载作者：塔克拉玛干更新时间：2023-11-03 05:34:02

24

4

我正在尝试通过标记拆分 HTML 字符串，以便在不显示完整帖子的情况下创建博客预览。这比我最初想象的要更难。以下是问题:

用户将创建 HTML通过所见即所得的编辑器(CKEditor)。标记不能保证是漂亮或一致。
token ，read_more()，可以放置在字符串中的任何位置，包括嵌套在段落标记。
得到的第一个分割字符串必须是对所有人有效的 HTML代币的合理使用。

可能的用途示例:

<p>Some text here. read_more()</p>

<p>Some text read more() here.</p>

<p>read_more()</p>

<p>  read_more()</p>

read_more()

到目前为止，我已经尝试过只拆分 token 上的字符串，但它留下了无效的 HTML。正则表达式也许是另一种选择。你会用什么策略来解决这个问题并让它尽可能地防弹？任何代码片段或提示也将不胜感激(我使用的是 PHP)。

最佳答案

function stripmore($in)
{
    list($p1,$p2) = explode("read_more()",$in,2);

    $pass1 = preg_replace("~>[^<>]+<~","><",$p2);
    $pass2 = preg_replace("~^[^<>]+~","",$pass1);

    $pass3 = null;
    while ( $pass3 != $pass2 )
    {
        if ( $pass3 !== null ) $pass2 = $pass3;
        $pass3 = preg_replace("~<([^<>]+)></\\1>~","",$pass2);
    }

    return $p1."read_more()".$pass3;
}

这会去除 read_more() 标记之后的任何非 html，并通过去除相应的标签将其减少到最小值，同时保持任何标记在标记之前开始和结束之后:

<p>Some text here. read_more()</p>
      ==> <p>Some text here. read_more()</p>

<p>Some <b>text</b> read_more() <b>here</b>.</p>
      ==> <p>Some <b>text</b> read_more()</p>

<p>Some <b>text read_more() here</b>.</p>
      ==> <p>Some <b>text read_more()</b></p>

关于php - 拼图 : Splitting An HTML String Correctly，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3380407/

24

4

0

文章推荐： php - drupal View 对这个用例有用吗

文章推荐： java - 使用java在base -2中创建二进制数组

文章推荐： PHP:修剪对象中的每个元素，如果为空，则设置为 N/A

java - SQL 连接悬空 : Where am I not correctly closing up connections correctly?
我正在构建一个基本的 Java 应用程序来将一些文件加载到 mysql 数据库中。我能够毫无问题地加载文件并填充我的表。然而，在与审查我的代码的人交谈后，我显然没有正确关闭我的连接并浪费资源。我在
c++ - 构建依赖于非 const-correct 库的 const-correct (C++) 库
我正在用 C++ 构建一个库(主要是为了好玩)，我已经研究了一段时间(多年，哈哈，这只是一种爱好) 我最近将一些基础(阅读、库依赖)切换到了另一个库。不幸的是，该库根本不关心“const-correc
c++ - DirectX/C++ : Texture Coordinates not "correct" in-engine correctly after Obj export
如果我绘制单个平面，则纹理坐标会正确映射。 (4 Verts, 4 TC, 6 Indices(2 polys)) 即使它被 segmentation ，(9 Verts, 9 TC, 27 Indi
.net - Azure WindowsCryptographicException : The specified network password is not correct when publishing despite correct password
我正在从文件系统上的 pfx 加载 x509 证书 new X509Certificate2(@"Resources\certificate.pfx", "Password123") 在本地，这工作正
jsf-2 - h :form rendered correctly, 但 h :commandLink doesn't get rendered correctly. 我必须在链接上单击两次
我知道这个问题被问了一遍又一遍。我确实喜欢在与此相关的所有问题中提出建议，并且我在 this question that I put 中做了 BalusC 的操作。告诉我，我还没有成功。所以网络应
php - CakePHP : Incrementing correctly based on last value in DB table (check for correct number base)
简而言之，我正在制作一个预订应用程序。预订 ID 需要从 10000 开始，并在每次新预订时增加 1。我已经开始编写生成此预订编号的方法。我正在努力的是: 第一次运行时，不会有预订编号，所以我不能简
correctness - 如何第一时间写出正确的代码？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
PHP 开关语句 : is this correct?
我查看了 php.net 上的 switch 文档，据我所知，它检查了 switch 和 case 中的变量之间的相等性比较。但是，以下代码似乎适用于所有可能的值(int、null、数组、其他): $
junit - "correct"这组JUnit测试的写法是什么？
我正在为以多种方式创建和作用于实体的服务编写 JUnit 测试。我希望我的测试能够尝试多种不同的事件组合。我有这样的东西: test1() { /** create entity **/ /** as
delphi - "correct"在Delphi中定义快捷方式的方法是什么？
关于如何在 Delphi 程序中定义 ShortCut 的示例有很多，但是它们归结为两种不同的方式: 将任意 scCtrl、scShift 和 scAlt 常量添加到键的 Ord() 使用 Menus
javascript - Javascript对象和继承的首次尝试: is it correct
我正在尝试学习如何在 Javascript 中创建类以及如何执行对象继承。我已经遵循了一些教程，但我不确定我的代码是否正确。我是否正确创建了公共(public)函数和属性？如果不是，我应该改变什么？
javascript - "Correct"使用JQuery访问表单元素值的方法
任何写过 javascript/jquery 的人都知道，有很多不同的方法可以做同样的事情。我目前正在尝试通过表单提交和 AJAX 请求向服务器发送一些数据，我想知道执行此操作的“正确”方法是什么。
error-correction - 单字节纠错
一条 200 字节的消息有一个随机字节损坏。修复损坏字节的最有效方法是什么？ A Hamming(255,247)代码有 8 个字节的开销，但实现起来很简单。 Reed-Solomon error
c++ - 如何制作未定义的移位 “correct”
在C++中，将n -bit整数移位n是未定义的行为: std::uint64_t v = 1; v = v = 64 ? 0 : v > 6; uint64_t mask = (!!temp)
java - 使用鼠标事件 : Am I doing this correctly?
我对 MouseEvents 和 MouseListeners 非常陌生，最近我问了一个关于创建篮球投篮图表的问题。到目前为止我所拥有的是这个 import javax.swing.*; im
代码厨师 : Correct approach or not?
http://www.codechef.com/OCT14/problems/PRLADDU 这是当前的运行比赛。我不想要它的答案，只是让我知道我的方法是否正确。我遵循的方法是按交换方式添加人和恐
python - "Correct"在python网站中存储postgres密码的方法
我正在用 Python(在 Linux 系统上的 Apache 服务器上)编写一个需要连接到 Postgres 数据库的 Web 应用程序。因此，它需要数据库服务器的有效密码。在我的 Python 文
javascript - 单选按钮选择时显示 "Correct"
我对 JS 和 HTML5 有点陌生。我正在创建一个简单的测验，只是为了好玩。我知道需要使每个问题都能够独立于其他问题而被标记为“正确”。我如何通过 JS，甚至 CSS/HTML5 来做到这一点？我感
javascript - "correctly"如何创建一个继承自Element的对象？
我正在编写一个涉及大量 XML 操作的 HTML5 应用程序，其中部分操作涉及比较两个不同 XML 元素的版本。我需要的是每个 Element、Attr 和 TextNode(所有这些都继承自 No
java - 'correct' 实例化JPA管理器bean的方法？
我正在使用 IBM RAD 开发一些 JPA 实体，并从中开发相应的 JPA Manager Bean。管理器 bean(由 RAD 生成)具有以下成员: @PersistenceUnit priva

首页

博学

6Ren·AI

商城

php - 拼图 : Splitting An HTML String Correctly