稍微解析一下标题后,只需对引用使用一个简单的分隔符即可,即 useDelim-6ren">
gpt4 book ai didi

Java - 使用扫描仪读取字符串给我奇怪的字符

转载 作者:行者123 更新时间:2023-11-30 07:16:57 25 4
gpt4 key购买 nike

字符串如何保存:

<title="<html><center>TURN: Washington's Spies (TV Series 2014– ) - IMDb</center></html>">

稍微解析一下标题后,只需对引用使用一个简单的分隔符即可,即

useDelimiter("\"")并使用

lineScanner.next() ,我得到的标题是

TURN: Washington's Spies (TV Series 2014– ) - IMDb

这就是我通过控制台得到的内容以及当我设置 JLabel 文本时看到的内容。我想要的是

TURN: Washington's Spies (TV Series 2014– ) - IMDb

如何避免这种情况?

最佳答案

TV Series 2014 后面的 字符是 unicode 符号 En dash

使用UTF-8编码,这是E2 80 93(十六进制)。

您的扫描仪似乎不知道他正在读取 UTF-8 编码的字符串,但认为它是 Windows-1252 编码的字符串,因此它正在读取 3字符 E2(â)、80(€) 和 93(“):

How do I avoid this?

让您的扫描仪读取UTF-8:Read utf-8 using Scanner

lineScanner = new Scanner(/*...*/, "UTF-8"); 

关于Java - 使用扫描仪读取字符串给我奇怪的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38207589/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com