gpt4 book ai didi

url - url 中的 % 符号是什么意思?

转载 作者:行者123 更新时间:2023-12-01 21:24:22 24 4
gpt4 key购买 nike

当我复制粘贴这篇维基百科文章时,它看起来像这样。

http://en.wikipedia.org/wiki/Gruy%C3%A8re_%28cheese%29

但是,如果您将其粘贴回 URL 地址,百分号就会消失,并且看似 Unicode 字符(可能还有特殊 URL 字符)的内容会取代百分号。

这些是 Unicode 和特殊 URL 字符的缩写吗?

我习惯在 JavaScript 中看到\u00ff 等。

最佳答案

您要查找的引用号是 RFC 3987: Internationalized Resource Identifiers ,具体来说the section on mapping IRIs to URIs .

RFC 3986: Uniform Resource Identifiers指定保留字符必须为 percent-encoded ,但它还指定将百分比编码的字符解码为 US-ASCII,其中不包括 è 等字符。

RFC 3987 指定非 ASCII 字符应首先编码为 UTF-8因此它们可以按照 RFC 3986 进行百分比编码。如果您允许我用 Python 进行说明:

>>> u'è'.encode('utf-8')
'\xc3\xa8'

在这里,我要求 Python 使用 UTF-8 将 Unicode è 编码为字节字符串。返回的字节是 0xc30xa8。百分比编码,这看起来像 %C3%A8

出现在 URL 中的括号确实适合 US-ASCII,因此它们使用 US-ASCII 代码点进行百分比转义,这也是有效的 UTF-8。

所以,不,不存在简单的 16×16 表——这样的表永远无法代表 Unicode 的丰富性。但有一种方法可以解决这种表面上的疯狂。

关于url - url 中的 % 符号是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18302178/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com