- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 Java 中,我正在从以 Shift-JIS 格式编码的文件中读取字节数组,但获取的字符串中字符的“样式”看起来与普通字符串不同(更宽?)。以下是我对“P”字母含义的示例:
P - P
正如您所看到的,Shift-JIS 中的第一个看起来与第二个不同。有没有办法即使对于 Shift-JIS 字符串也可以使用“正常”字符?
我正在使用这段代码来执行转换:
String jis = new String(byteArray, Charset.forName("Shift_JIS"));
最佳答案
严格来说,这是不同的角色。第一个 P
是 Unicode 中的全角拉丁大写字母 P
,来自日语 JIS X 0208 字符集 (U+FF30)。第二个 P
是来自 ASCII (U+0050) 的拉丁大写字母 P
。
因此,您必须将全角字符转换为半角字符。您可以使用 ICU4J 的 Transliterator 来完成此操作.
Transliterator transliterator = Transliterator.getInstance("Halfwidth-Fullwidth");
String result = transliterator.transliterate("P - P");
System.out.println(result); // You will get "P - P"
关于java - Shift-JIS 编码字符串的不同字体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37992270/
我目前正在使用 Shift-JIS 格式的输出 CSV 文件进行一些测试,但不知何故,我发现在日语字符差异的试验中很奇怪,如下所示: 我的代码: try { String dat2 =
我尝试了很多方法将 MySQL 列中的 utf8_unicode_ci 值从 utf8_unicode_ci 转换为 shift_jis 但它不是得到修复。 原始列值在 shift_jis 中,并在使
我必须存储从互联网上获取的以 Shift-JIS 格式编写的日语名称序列。我正在考虑将它们存储在字符数组中并将它们写入一个文件,例如: fprintf(fp,"The name is [%s]\n",
如何在 android 中解码 shift-JIS(将其转换为字符串)? 我尝试过类似的方法,但它不起作用 编码: String test = "some text"; byte[] bytes =
在 Java 中,我正在从以 Shift-JIS 格式编码的文件中读取字节数组,但获取的字符串中字符的“样式”看起来与普通字符串不同(更宽?)。以下是我对“P”字母含义的示例: P - P 正如您所看
在运行一个小型 vba 应用程序时,我想检查某个名称是否存在,例如エンジン回転数 通过简单地将单元格值与预定义的字符串匹配而出现在我的表格中。 如何在 VBA 中存储此字符串エンジン回転数?我的第一个
这怎么可能?这是一个错误吗? (Python 2.7.12 和 Python 3.5.1 中的行为相同。) In [1]: yen = u'\u00A5' In [2]: print(yen) ¥ I
在 net45 中,Encoding.GetEncoding("Shift-JIS") 工作正常,但在 netstandard 下它会抛出: System.ArgumentException : 'S
我有一个程序,其中我使用 TextOut() 在屏幕上打印普通的 ASCII 字符串。我现在想添加打印 Shift-JIS 编码字符串的功能。我可以以某种方式告诉 TextOut() 我想打印 Shi
我目前在一个有两个版本的网站上工作,一个美国网站使用 utf-8,另一个日本版本使用 Shift JIS。该站点是使用 Perl 生成的。 问题: 我正在提供类似于以下内容的 Javascript。
我正在尝试解码 shift-jis 编码的字符串,如下所示: string.decode('shift-jis').encode('utf-8') 能够在我的程序中查看它。 当我遇到 2 个 shif
当前电子邮件为 UTF-8。它不适用于 Shift-JIS。 如何从 UTF-8 转换为 SHIFT-JIS。解决方案需要是 PHP 解决方案。 这是我目前的尝试 $subject = mb_conv
我正在尝试读取以实用方式下载和提取的日语内容 CSV 文件。 读取CSV的代码 String splitBy = ","; BufferedReader br;// = n
我编写了简单的转换代码,将 UTF-8 转换为日语字符。 private static String convertUTF8ToShiftJ(String uft8Strg) {
我正在从 Aozora Bunko 获取 html 源代码. Html 文件是 Shift-JIS 编码的。我正在尝试获取书名和作者。然后我想将标题和作者记录到 SQLite(UTF-8) 数据库中。
使用的变量: JavaSE-6 没有框架 给定此字符串输入 ピーター・ジョーズ它以 UTF-8 编码,我在将所述字符串转换为 Shift-JIS 时遇到问题,而无需将所述数据写入文件。 输入(UTF-
我有一个包含四个日文字符的 Unicode 字符串,我正在使用 WideCharToMultiByte 将其转换为指定 Shift-JIS 代码页 932 的多字节字符串。为了获得所需缓冲区的大小,我
我正在尝试读取包含一些日语文本的 CSV 文件,并将该文件中的一些数据写入数据库。 CSV 是通过一些我不太熟悉的 Flex 代码上传的。但在我的后端,我有简单的 byte[] 和文件内容。我正在使用
我正在处理日语文件,但我对此语言一无所知。该文件采用 S-JIS 编码。现在,我应该将内容转换为 UTF-8,以便内容看起来像日语。而我在这里完全一片空白。我尝试了在互联网上找到的以下代码,但没有成功
如何在 C++ 中将 JIS X 208 编码字符串转换为 UNICODE? VC++ 特定的答案会有所帮助。 我发现难以理解的更大问题是日语字符的编码太多。 JIS本身有很多版本,然后就是Shift
我是一名优秀的程序员,十分优秀!