gpt4 book ai didi

HTML 字符实体和字符编码集

转载 作者:太空狗 更新时间:2023-10-29 13:24:16 26 4
gpt4 key购买 nike

当在 HTML 文档中包含 HTML 实体时,实体是否需要来自文档指定使用的相同字符编码集?

例如,如果我要在指定为 UTF-8 的 HTML 文档中使用版权标志,是否有必要使用 Unicode HTML 实体 (© ;) 还是可以使用其他实体,例如 ASCII HTML 实体 (©)?

请解释你的答案。我知道它会“起作用”,但是否存在不起作用的情况?

谢谢!

最佳答案

©©指定相同的字符 - 169 相当于十六进制 A9。它们都指定了版权符号。 HTML 中的字符实体始终引用 Unicode 代码点,这在 HTML 4 Standard 中有所介绍.因此,即使您的字符集发生变化,您的实体仍然引用相同的字符。

这也意味着您可以对实际上没有出现在您选择的字符集中的字符进行编码。我刚刚在 ISO-8859-1 字符集中创建了一个文档,但它包含一个希腊语 lambda。此外,ASCII 不能直接对版权符号进行编码,但可以通过字符实体进行编码。

编辑: 阅读其他答案的评论,我想澄清一下。如果您使用 UTF-8 作为文档的字符编码,则可以在原始 HTML 源代码中按原样编写版权符号。 (当然,您需要找到某种输入方式:通常是复制粘贴。)UTF-8 将允许您直接编码您想要的任何符号。 ISO-8859-1 的限制要多得多,ASCII 更是如此。例如,在我的 HTML 中,如果我的文档是 UTF-8 文档,我可以:

<p>Hi there. This document is ©2010. Good day!</p>

或:

<p>Hi there. This document is &#xA9;2010. Good day!</p>

或:

<p>Hi there. This document is &copy;2010. Good day!</p>

第一个仅在字符集支持“©”时有效。其他两个始终有效,但可读性较差。无论您使用何种文本编辑器,如果物有所值,都应该能够告诉您它使用什么字符集对文档进行编码。

如果你这样做,你需要确保你的网络服务器通知客户端正确的字符集,或者你的文档用类似的东西声明它:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

我在那里使用 UTF-8 作为示例。 XHTML 应该在开头设置字符 <?xml ... ?>标签。

关于HTML 字符实体和字符编码集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3593024/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com