- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的理解是Java默认使用UTF-16(对于String
和char
以及可能的其他类型)并且UTF-16是地球上大多数字符编码的主要超集(尽管我可能是错的)。但我需要一种方法来保护我的应用程序,以防止它读取使用 UTF-16 不支持的编码(我不确定是否有很多或根本没有)生成的文件。
所以我问:
OutputStream
等)写入字符串或文件时产生垃圾文本/字符。理想情况下,我希望有某种方法来确保这个产生垃圾的字符在进入我正在编写的文件之前以某种方式被捕获。我该如何防范这种情况?提前致谢。
最佳答案
Java normally uses UTF-16 for its internal representation of characters 。 Java char
数组是 UTF-16 编码的 Unicode 代码点的序列。默认情况下,char
值被视为 Big Endian(与任何 Java 基本类型一样)。但是,您不应使用 char
值将字符串写入文件或内存。您应该使用 Java API 中的字符编码/解码功能(见下文)。
UTF-16 不是编码的主要超集。实际上,UTF-8 和 UTF-16 都可以对任何 Unicode 代码点进行编码。从这个意义上说,Unicode确实定义了您可能想在现代通信中使用的几乎所有字符。
如果您从磁盘读取文件并假定 UTF-16,那么您很快就会遇到麻烦。大多数文本文件使用 ASCII 或 ASCII 的扩展来使用一个字节的所有 8 位。这些扩展的示例包括 UTF-8(可用于读取任何 ASCII 文本)或 ISO 8859-1(拉丁文)。然后有很多编码,例如由作为这些扩展的扩展的 Windows 使用。 UTF-16 不与 ASCII 兼容,因此不应将其用作大多数应用程序的默认值。
所以,是的,如果您想读取大量编码未知的纯文本文件,请使用某种检测器。这应该可以回答问题 #1。
对于问题#2,想象一个完全是 ASCII 的文件。现在您想要添加一个不在 ASCII 中的字符。您选择 UTF-8(这是一个非常安全的选择)。无法知道打开文件的程序是否正确猜测它应该使用 UTF-8。它可能会尝试使用拉丁语,甚至更糟糕,假设使用 7 位 ASCII。在这种情况下,你会得到垃圾。不幸的是,没有任何聪明的技巧可以确保这种情况永远不会发生。
查看CharsetEncoder
和 CharsetDecoder
类来了解 Java 如何处理编码/解码。
关于当 UTF-16 无法解决问题时,Java 会采取保护措施,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15099548/
一、前言: Python如何使用OS模块调用cmd 在os模块中提供了两种调用 cmd 的方法,os.popen() 和 os.system() os.system(cmd) 是在执行command命
我对双链表进行了简化。我的双链表是一个以头和尾为节点的结构。 有一个函数可以创建列表并返回它。在同一函数中,我执行尾节点和头节点之间的链接。问题是,当我返回列表(因此转到函数之外)时,所有链接都消失了
我有这个信息。 let params2: [String: AnyObject] = [ "app_token": myapptoken, "member_access_token":
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 7 年前。 Improve
我正在尝试发出解析为特定 IP 的 cURL 请求。从我读过的所有内容来看,这在我看来在语法上是正确的,但我仍然看到“无法解决主机错误”。有人能指出我正确的方向吗?我看到了各种错误: curl —-r
我正在尝试使用 curl 在 jira 服务器中获取数据。我试过这个命令 curl -u username:password -X GET -H "Content-Type: applicat
因此,下面的代码有时会起作用,有时它会添加&符号(到复制缓冲区),我试图从文本字符串中删除它。 代码的要点是将字符串从正确位置复制到与号之前。但是,在随机情况下,它仍然会添加 & 符号。 Privat
p = Int('p') q = Int('q') s = Solver() s.add(1<=p<=9, 1<=q<=19, 5<(3*p-4*q)<10) s.check() print s.mo
我在这里阅读了分配问题的解决方案:http://www.topcoder.com/tc?module=Static&d1=tutorials&d2=hungarianAlgorithm 我了解 O(n
控制台中显示警告: the id param was not provided. 文档提到将使用当前路由: current is the current Route by default (most
我正在尝试使用hector-core作为grails Maven构建中的依赖项。 me.prettyprint hector-core 1.0-3 bundle 我收到一个错误 [
我正在尝试使用 JavaScript 变得更好,并且我在破坏页面方面做得非常好:))))) 我正在尝试使用 Firebug 进行调试,但一开始有点困惑。它的哪个选项卡用于调试 JavaScript?我
我正在使用最新的 Angular + Firebase 并尝试设置登录授权系统。我有包含登录+注册链接的 home.html,转到 login.html 并添加凭据工作正常(提交时记录正确的 UID)
我有一个 iPad 应用,现在需要将其转换为通用应用。我已将目标设置为 Universal,现在它也可以部署到 iPhone,但是,我有一个主要问题:即使我已经创建了我的 main分别查看两种设备类型
我在 CSS 中使用媒体查询来根据 IE11 和 Chrome 的屏幕分辨率缩放我的网页。当我运行 this webpage在我的 2 个不同屏幕上的 chrome(顺便说一句,我用它来确定我的最小宽
我正在解决nodeschool练习“Juggling Async”,我是这样解决的 var http=require("http"); var urls=process.argv.slice(2,pr
我试图相对神秘地要求一个文件,发生了以下情况 这很好,它指向 /Users/marcos/Desktop/Taper/lib/utils.js myPath = "/Users/marcos/Desk
我正在尝试解决一个项目,但遇到了问题。 • 您的程序应该显示一个菜单,允许用户执行以下操作以下操作(注:使用GUI): 添加新客户 删除客户 修改客户信息//此选项必须显示子菜单: --------1
我需要 x 图标来删除输入字段值1. 当用户键入任何内容时,将显示“x”图标 如果输入框中没有可用的值,x 将被隐藏 当输入框中的值可用并且焦点移出输入框时,我们需要隐藏 x 图标并聚焦,我们需要再次
我正在使用 ajs(1.4.7) 和 angular-ui-router(0.2.15) 开发一个简单的 AJS 应用程序。 经历了this文章并选择了路由解析技术。 这是我遇到的错误 错误:[$in
我是一名优秀的程序员,十分优秀!