- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们在基于 Debian 的 LAMP 安装上托管 PHP 应用程序。一切都很好——性能、行政和管理方面。然而,作为新开发人员(我们还在高中),我们在西方字符集的字符编码方面遇到了一些问题。
经过大量研究,我得出的结论是网上的信息有些困惑。它谈论的是 Windows-1252 是 ANSI 且完全是 ISO-8859-1兼容。
无论如何,Windows-1252(1/3/4) 和 Windows-1252(1/3/4) 之间有什么区别ISO-8859-1?
无论如何,ANSI 是从哪里来的呢?
我们应该在 Debian 服务器(和工作站)上使用什么编码以确保客户获得预期的所有信息方式,并且我们不会在途中丢失任何字符?
最佳答案
我想以一种更像网络的方式来回答这个问题,为了回答这个问题,我们需要一些历史。 Joel Spolsky写了很good introductionary article每个开发人员都应该了解 Unicode 字符编码的最低限度知识。请耐心听我说,因为这将有点像 looong
回答。 :)
作为历史,我将引用其中的一些引述:(非常感谢乔尔!:))
The only characters that mattered were good old unaccented English letters, and we had a code for them called ASCII which was able to represent every character using a number between 32 and 127. Space was 32, the letter "A" was 65, etc. This could conveniently be stored in 7 bits. Most computers in those days were using 8-bit bytes, so not only could you store every possible ASCII character, but you had a whole bit to spare, which, if you were wicked, you could use for your own devious purposes.
And all was good, assuming you were an English speaker. Because bytes have room for up to eight bits, lots of people got to thinking, "gosh, we can use the codes 128-255 for our own purposes." The trouble was, lots of people had this idea at the same time, and they had their own ideas of what should go where in the space from 128 to 255.
所以现在“OEM 字符集”随 PC 一起分发,但它们仍然不同且不兼容。令我们当代人惊讶的是——一切都很好!他们没有互联网,人们很少在不同区域设置的系统之间交换文件。
乔尔继续说道:
In fact as soon as people started buying PCs outside of America all kinds of different OEM character sets were dreamed up, which all used the top 128 characters for their own purposes. Eventually this OEM free-for-all got codified in the ANSI standard. In the ANSI standard, everybody agreed on what to do below 128, which was pretty much the same as ASCII, but there were lots of different ways to handle the characters from 128 and on up, depending on where you lived. These different systems were called code pages.
这就是“Windows 代码页”最终诞生的方式。它们实际上是 DOS 代码页的“父级”。然后Unicode诞生了! :) 和 UTF-8是“用于存储 Unicode 代码点字符串的另一个系统”,实际上“从 0-127 的每个代码点都存储在单个字节中”,与 ASCII 相同。 。我不会再详细讨论 Unicode 和 UTF-8,但您应该阅读 BOM , Endianness和 Character Encoding作为一名将军。
关于“ANSI阴谋”,微软实际上承认Windows-1252的错误标签在 glossary of terms :
The so-called Windows character set (WinLatin1, or Windows code page 1252, to be exact) uses some of those positions for printable characters. Thus, the Windows character set is NOT identical with ISO 8859-1. The Windows character set is often called "ANSI character set", but this is SERIOUSLY MISLEADING. It has NOT been approved by ANSI.
因此,ANSI 在引用 Windows 字符集时并未经过 ANSI 认证! :)
正如 Jukka 所指出的(感谢您的出色回答)
Windows-1252 ISO Latin 1, also known as ISO-8859-1 as a character encoding, so that the code range 0x80 to 0x9F is reserved for control characters in ISO-8859-1 (so-called C1 Controls), wheres in Windows-1252, some of the codes there are assigned to printable characters (mostly punctuation characters), others are left undefined.
但是,我个人的观点和技术理解是,Windows-1252 和 ISO-8859-1 都不是网络编码! :) 所以:
对于网页,请使用 UTF-8 作为内容编码因此,将数据存储为 UTF-8 并使用 HTTP Header“吐出” :Content-Type: text/html; charset=utf-8
.
还有一种称为 HTML 内容类型元标记: <html>
现在,浏览器在遇到此标记时实际执行的操作是再次从 HTML 文档的开头开始,以便可以按照声明的编码重新解释文档。仅当没有“Content-type” header 时才会发生这种情况。
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
如果系统的用户需要从系统生成文件,请使用其他特定编码。例如,一些西方用户可能需要 Excel 生成的文件,或 Windows-1252 中的 CSV。如果是这种情况,请在该区域设置中编码文本,然后将其存储在文件系统上并将其作为可下载文件提供。
在HTTP 设计中还有一件事需要注意:内容编码分发机制应该像这样工作。
I. 客户端通过“Accept”和“Accept-Charset”request headers 请求特定内容类型和编码的网页。 .
II.然后服务器(或 Web 应用程序)返回转码为该编码和字符集的内容。
大多数现代网络应用程序并非如此。 Web 应用程序以 UTF-8 形式提供(强制客户端)内容时实际发生了什么。这是有效的,因为浏览器根据响应 header 解释接收到的文档,而不是根据他们实际期望的内容。
我们都应该使用 Unicode,所以请尽可能使用 UTF-8 来分发您的内容,最重要的是适用。否则the elders of the Internet会困扰你! :)
关于encoding - Windows-1252 和 ISO-8859-1 之间的确切区别是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19109899/
为什么我可以在控制台 window.window.window.window 中执行此操作并无限追加 .window 并返回 DOM 窗口? 最佳答案 因为 window 对象有一个指向它自身的 wi
Windows管理员用户和系统用户之间有什么权限区别吗? 有些时候,我必须将 cmd 窗口提升到系统权限才能删除一些文件。这可能是因为系统用户锁定了文件,或者系统用户可能具有更高的访问权限,我希望找出
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
Windows 服务和 Windows 进程之间的区别是什么? 最佳答案 服务是真正的 Windows 进程,没有区别。服务的唯一特殊之处在于它由操作系统启动并在单独的 session 中运行。一个独
我有一个 Windows 网络 (peer-2-peer) 以及 Active Directory,我需要记录向服务器发送任何类型打印的用户的名称。我想编写一个程序来记录他们的用户名和/或他们各自的
当我让一个 Windows 服务尝试安装另一个 Windows 服务时遇到问题。 具体来说,我有一个 TeamCity 代理在 Windows 2008 AWS 实例上为我运行测试。这些测试是用 Ja
我创建了一个应用程序来接收广播的 Windows 消息,效果很好。当我把它变成一个服务、安装它并启动服务时,该服务没有收到消息。 最佳答案 服务可能必须被授予访问桌面的权限。从服务属性、“登录”选项卡
我正在使用 Delphi 2010 编写应用程序。我希望在 Windows 启动时启动我的应用程序。我需要它在最新版本的 Windows XP、7.0 和最新的服务器中工作。 将其存储在以下关键工作下
我想开发一个适用于所有三个版本的 Windows XP、Vista 和 7 的应用程序。该应用程序允许人们选择要打开的文件,并允许他们在某些操作后保存文件。三个版本的 Windows 中的每一个都有不
对于\Windows\中的文件类型与\Windows\System32 中的文件类型是否有标准约定? 我正在开发一个 SDK,其中包含各种 DLL、帮助程序 exe 和 Windows 服务 exe。
要求是,必须在 WINDOWS7 机器上配置自动登录,但是这个自动登录应该等待(即延迟)直到另一个 Windows 服务发出继续自动登录的信号。 我使用了自定义凭据提供程序,它在其中等待另一个 Win
很抱歉,这不是一个大问题,而是更多的帮助人们解决这些特定问题的方法。我正在解决的问题要求使用串行I/O,但主要在Windows CE 6.0下运行。但是,最近有人问我是否也可以在Windows下运行该
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
不幸的是 SC 命令在 W2000 上还不可用,所以我不能使用它。 我正在尝试检查服务是否在 W2000 服务器上运行,如果它没有运行,脚本应该能够启动该服务。 如何在 Windows 2000 上执
如何在登录到 Windows 之前启动 Windows 窗体应用程序?是否可以在登录到 Windows 之前启动 Windows 窗体应用程序?如果不是,我是否有机会在登录前启动 Windows 服务
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我想在 XML 文件中区分 Windows XP 和 Windows 7。我想我会在 XML 中为它使用一个环境变量。 但是我找不到在 Windows 中定义的任何系统环境变量来提供此信息。 我看到了
有谁知道我可以在注册表中的哪个位置检查机器上是否安装了这些应用程序: Windows 通讯录 Windows 联系人 最佳答案 来自 Microsoft:我知道它说的是 win 95,但 reg 是一
我正在尝试从我的 Windows 服务器调用放置在远程 Windows 服务器上的批处理文件。我在远程服务器上安装了 freeSSHd。我尝试使用 putty/plink 但没有结果。 我使用的命令语
( 大家好。我是 Windows 编程的新手,所以如果已经有人问过我,我提前道歉,我只是不知道要搜索什么,但这个问题一直让我发疯,我知道有人可能真的很容易回答这个问题。) 我的公司有一个在 Windo
我是一名优秀的程序员,十分优秀!