gpt4 book ai didi

Java将字符流转换成人类 "readable"String

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:10:46 24 4
gpt4 key购买 nike

我有一堆看起来像这样的字符:

Комуникационна кабелна система

有时我会有这样的混合:

Généralités

第一个翻译成:

Комуникационна кабелна система

第二个:

通用

我可以使用浏览器看到它并将它们放入正文中。

但是我怎样才能让 java 输出“真正的”字符呢?上面的编码叫什么?

我已经尝试了一些东西,最后这个(没有用):

import java.nio.charset.*;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;

List<String> lst = new ArrayList<String>(); lst.add("&#1050;"); lst.add("&#1086;");
for ( String s : lst ) {

Charset utf8charset = Charset.forName("UTF-8");
Charset iso88591charset = Charset.forName("ISO-8859-1");

ByteBuffer inputBuffer = ByteBuffer.wrap( s.getBytes() );

// decode UTF-8
CharBuffer data = utf8charset.decode(inputBuffer);

// encode ISO-8559-1
ByteBuffer outputBuffer = iso88591charset.encode(data);
byte[] outputData = outputBuffer.array();

System.out.println ( new String(outputData) )
}

最佳答案

您可以使用 commons-lang逃脱这种事情。在 Groovy 中:

@Grab( 'commons-lang:commons-lang:2.6' )
import org.apache.commons.lang.StringEscapeUtils as SEU

def str = 'G&#233;n&#233;ralit&#233;s'

println SEU.unescapeHtml( str )

关于Java将字符流转换成人类 "readable"String,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9704237/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com