gpt4 book ai didi

java - UTF-8 字符串和二进制数据的问题

转载 作者:行者123 更新时间:2023-12-02 00:50:52 27 4
gpt4 key购买 nike

史前时期: Java regular expression for binary string

我可以用我需要的二进制数据提取子字符串,但是当我使用时

   String s = matcher.group(1);

看来数据被破坏了,
准确地说,被破坏的只是那些属于扩展ASCII表的字符,可能是从128到255。其他字符保持不变,但有些字符已损坏。我的基本意思是,我需要将这个“s ”字符串转换为字节数组,但是: String s2 = new String(s.getBytes(), "US-ASCII")

或者这个

String s2 = new String(s.getBytes(), "ISO-8859-1") 

及以后,

 fileOutputStream.write(s2.getBytes())

将扩展 ASCII 表中的所有字符替换为“?”,而\0 或“A”等其他字符则保持不变。

如何将字符串解释为普通的 [0-255] ascii 二进制符号?

PS我解决了,应该使用

    String encoding = "ISO-8859-1";

对字节数组进行编码/解码,一切都很完美。

最佳答案

What I basically mean, is that I need to transform this " s " string into byte array

直接回答这个问题:

byte[] array = Charset.forName("utf-8").encode(CharBuffer.wrap(s)).array();

编辑:
String 添加了一个辅助函数,它可以用更少的代码完成与上面相同的事情:

byte[] array = s.getBytes(Charset.forName("utf-8"));

关于java - UTF-8 字符串和二进制数据的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3263098/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com