gpt4 book ai didi

html - charset-utf8 和字符实体

转载 作者:行者123 更新时间:2023-11-27 22:50:31 27 4
gpt4 key购买 nike

我提议将我的 windows-1252 XHTML 网页转换为 UTF-8。

我的编码中有以下字符实体:

  • ' — 撇号,
  • — 右指针,
  • — 左指针。

如果我更改字符集并使用我的编辑器将页面保存为 UTF-8:

  • 撇号作为字符实体保留;
  • 指针在代码中转换为符号(大概是因为 UTF-8 不支持实体?)。

问题:

  1. 如果我对 UTF-8 的理解正确,您就不需要使用实体,可以直接在代码中键入字符。在哪种情况下,我可以安全地将 #39 替换为键入的撇号?

  2. 编辑器将指针符号直接放入我的代码中是否正确,这些符号是否会在现代浏览器上可靠地显示,看起来没问题?据推测,如果我使用 UTF-8,我无论如何都无法恢复为实体?

谢谢。

最佳答案

是字符集,不是图表集。

1) 这取决于撇号的使用位置,它也是一个有效的 ASCII 字符,因此取决于字符的意图(无论是仅用于显示(在 DOMText 节点内)还是用于代码中)你可能会也可能不会能够使用文字撇号。

2) 如果您的编辑器是现代编辑器,它将使用 utf 序列而不是仅使用 char 来显示文本。代码中使用的大多数序列只是普通的 ASCII(ASCII 是 utf8 的子集),因此这些字符将占用一个字节。其他字符可能会以特殊方式占用两个、三个甚至四个字节。它们仍然会作为一个字符显示给您,但是字符和字节之间的关系已经不同了。

无论如何;因为所有有效的 ASCII 字符在 ASCII、utf8 甚至 windows-1252 中都完全相同。使用 utf8 应该不会出现任何问题。您仍然可以使用数字和命名实体,因为它们是用那些有效字符编写的。您只是不必这样做。

附言所有现代浏览器都可以很好地处理 utf8。但我们对“现代”的定义可能会有所不同。

关于html - charset-utf8 和字符实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3922342/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com