- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
基于 strip_tags
文档,第二个参数采用允许的标签。但是,就我而言,我想反其道而行之。假设我将接受标签 script_tags
通常(默认)接受,但只去除 <script>
标签。有什么可能的方法吗?
我并不是说有人为我编写代码,而是非常感谢您提供有关如何实现此目的(如果可能)的可能方法。
最佳答案
编辑
使用 HTML 净化器 HTML.ForbiddenElements
配置指令,看起来你会做这样的事情:
require_once '/path/to/HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
$config->set('HTML.ForbiddenElements', array('script','style','applet'));
$purifier = new HTMLPurifier($config);
$clean_html = $purifier->purify($dirty_html);
HTML.ForbiddenElements
should be set to an array
.我不知道的是什么形式 array
成员应该采取:
array('script','style','applet')
或者:
array('<script>','<style>','<applet>')
或者……别的东西?
我认为这是第一种形式,没有分隔符; HTML.AllowedElements
使用一种与 TinyMCE's valid elements
syntax 有点通用的配置字符串形式:
tinyMCE.init({
...
valid_elements : "a[href|target=_blank],strong/b,div[align],br",
...
});
所以我的猜测是它只是术语,不应提供任何属性(因为您禁止该元素...尽管也有一个 HTML.ForbiddenAttributes
)。但这是一个猜测。
我将从 HTML.ForbiddenAttributes
添加这条注释文档,以及:
Warning: This directive complements
%HTML.ForbiddenElements
, accordingly, check out that directive for a discussion of why you should think twice before using this directive.
黑名单并不像白名单那样“稳健”,但您可能有自己的理由。小心点,小心点。
没有测试,我不知道该告诉你什么。我会继续寻找答案,但我可能会先去 sleep 。已经很晚了。 :)
虽然我认为你真的应该使用 HTML Purifier并利用它的 HTML.ForbiddenElements
配置指令,如果你真的非常想使用 strip_tags()
,我认为这是一个合理的选择就是从黑名单中推导出白名单。换句话说,删除不需要的,然后使用剩下的。
例如:
function blacklistElements($blacklisted = '', &$errors = array()) {
if ((string)$blacklisted == '') {
$errors[] = 'Empty string.';
return array();
}
$html5 = array(
"<menu>","<command>","<summary>","<details>","<meter>","<progress>",
"<output>","<keygen>","<textarea>","<option>","<optgroup>","<datalist>",
"<select>","<button>","<input>","<label>","<legend>","<fieldset>","<form>",
"<th>","<td>","<tr>","<tfoot>","<thead>","<tbody>","<col>","<colgroup>",
"<caption>","<table>","<math>","<svg>","<area>","<map>","<canvas>","<track>",
"<source>","<audio>","<video>","<param>","<object>","<embed>","<iframe>",
"<img>","<del>","<ins>","<wbr>","<br>","<span>","<bdo>","<bdi>","<rp>","<rt>",
"<ruby>","<mark>","<u>","<b>","<i>","<sup>","<sub>","<kbd>","<samp>","<var>",
"<code>","<time>","<data>","<abbr>","<dfn>","<q>","<cite>","<s>","<small>",
"<strong>","<em>","<a>","<div>","<figcaption>","<figure>","<dd>","<dt>",
"<dl>","<li>","<ul>","<ol>","<blockquote>","<pre>","<hr>","<p>","<address>",
"<footer>","<header>","<hgroup>","<aside>","<article>","<nav>","<section>",
"<body>","<noscript>","<script>","<style>","<meta>","<link>","<base>",
"<title>","<head>","<html>"
);
$list = trim(strtolower($blacklisted));
$list = preg_replace('/[^a-z ]/i', '', $list);
$list = '<' . str_replace(' ', '> <', $list) . '>';
$list = array_map('trim', explode(' ', $list));
return array_diff($html5, $list);
}
然后运行它:
$blacklisted = '<html> <bogus> <EM> em li ol';
$whitelist = blacklistElements($blacklisted);
if (count($errors)) {
echo "There were errors.\n";
print_r($errors);
echo "\n";
} else {
// Do strip_tags() ...
}
因此,如果您传入您不想允许的内容,它会在 array
中返回给您 HTML5 元素列表。然后您可以输入 strip_tags()
的表格将其连接成一个字符串后:
$stripped = strip_tags($html, implode('', $whitelist)));
买者自负
现在,我已经解决了这个问题,我知道还有一些问题我还没有考虑到。例如,来自 strip_tags()
man page对于 $allowable_tags
参数:
Note:
This parameter should not contain whitespace.
strip_tags()
sees a tag as a case-insensitive string between<
and the first whitespace or>
. It means thatstrip_tags("<br/>", "<br>")
returns an empty string.
已经晚了,出于某种原因,我不太明白这对这种方法意味着什么。所以明天我得考虑一下。我还在函数的 $html5
中编译了 HTML 元素列表。来自这个 MDN documentation page 的元素.眼尖的读者可能会注意到所有的标签都是这种形式:
<tagName>
我不确定这将如何影响结果,我是否需要考虑使用 shorttag <tagName/>
的变化还有一些,咳咳,奇怪的变化。当然,还有 more tags out there .
所以它可能还没有准备好生产。但你明白了。
关于php - strip_tags 不允许某些标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12362426/
我有一个 ASP.NET 网站,我希望只允许 AD 组中的用户访问该网站。我正在使用如下的 web.config 片段,但这似乎不起作用:
仅当选中所有框时才应禁用“允许”按钮。我该怎么做?我已经完成了 HTML 部分,如下所示。如何执行其中的逻辑部分?即使未选中一个复选框,也应禁用“允许”按钮
当前有一个Navigator.push(context,route),但是上下文部分返回了错误,在尝试调试后,我发现问题是因为我在调用一个函数而不是直接将home设置为widget树。但是现在我不确定
这是我的邮政编码正则表达式 ^[a-zA-Z0-9]{1,9}$ 但不允许 A-12345。如何更改 - 也将被允许的正则表达式? 最佳答案 在字符集的开头或结尾添加-([...]): ^[-a-zA
我目前正在建立我的网站,但遇到了一个问题 JavaScript 中的混合内容阻止 当我尝试加载和显示来自 的图像和页面时,Chrome、Mozilla 和 Explorer 会发生这种情况http 我
我见过使用: [mysqld] bind-address = 255.112.324.12 允许远程访问单个 IP。我如何允许从 mysql 远程访问所有 IP? 最佳答案 如果你想允许它用于所
我想知道是否可以使用模板实现某些功能。我想要做的是允许特定的“复制构造函数和赋值运算符”从一个模板到另一个模板并禁用其他模板。 我想我只完成了一件我想要的事情,所以我提供了下面的类(class)。对于
这个问题在这里已经有了答案: How to validate an email address in PHP (15 个答案) 关闭 2 年前。 正则表达式让我大吃一惊。我如何更改此设置以验证带有加
解析可以采用以下格式之一的日期的最佳方法是什么 "dd-MM-yyyy HH:mm" "dd/MM/yyyy HH:mm" "dd.MM.yyyy HH:mm" 无需创建 3 个 SimpleD
我们知道,下面的代码格式不正确,因为成员 x 在依赖的基类中。但是,将指定行上的 x 更改为 this->x 将修复错误。 template struct B { int x; }; tem
如果能帮助我理解“Java 并发实践”中的以下内容,我将不胜感激: Calling an overrideable instance method(one that is neither privat
此时如果上传一个不在预定义的安全扩展名列表,如.lrc,会报错: File type does not meet security guidelines. Try another. 解决此问题有
我有一个运行韵律,可以为我的几个域和一个 friend 域处理 XMPP。我 friend 域中的一位用户(他的妻子)想更改她的密码(实际上她忘记了她,所以我会用 prosodyctl 设置一个,然后
使用 nginx,您可以允许和拒绝范围和 ips (https://www.nginx.com/resources/admin-guide/restricting-access/)。使用realip模
什么是一些好的克里金法/插值想法/选项,可以让重度权重的点在绘制的 R map 上的轻权重点上流血? 康涅狄格州有八个县。我找到了质心并想绘制这八个县中每个县的贫困率。其中三个县人口稠密(约 100
我正在使用 virtualbox + ubuntu + vagrant . 但是我不能ping或 wget任何网址。请指导我如何允许虚拟机访问我的主机的互联网? 最佳答案 这对我有用。 使用此配置 V
标题可能有点令人困惑,所以让我向您解释一下。 在 Swift 中,我们可以拥有带有默认参数值的函数,例如: func foo(value: Int = 32) { } 我们也可以有 In-Out 参数
有TextView1 和TextView2。 TextView2 应该 float 在 TextView1 的右侧。只要两个 TextView 的总宽度不使 TextView2 与右侧的框重叠,Tex
使用 Magento 收集方法 addFieldToFilter 时是否可以允许按 NULL 值进行过滤?我想选择集合中具有自定义属性的所有产品,即使没有为该属性分配任何值。 最佳答案 您不需要使用
我正试图从 .htaccess 文件中的规则中“排除”一个目录(及其所有文件夹)... 不确定这是否可能? .htaccess 文件是这样的: Order Allow,Deny Deny from a
我是一名优秀的程序员,十分优秀!