gpt4 book ai didi

java - 网站中的希伯来语渲染

转载 作者:可可西里 更新时间:2023-11-01 17:36:04 25 4
gpt4 key购买 nike

我正在开发具有互联网“管理面板”的产品 - 用户可以在某个地方看到有关该产品的信息。最低要求之一是该网站同时具有英语和希伯来语版本。那么问题是什么?问题是有些字符看起来像 this ,但它们应该看起来像 this

当我收到来自浏览器的请求时,我使用以下代码 (JAVA) 读取 HTML 文件:

public static String loadPage(String page, String lang) {
Path path = Paths.get(System.getProperty("user.dir"), "htmlTemplate", lang, page + ".html");
try (BufferedReader br = Files.newBufferedReader(path)) {
StringBuilder website = new StringBuilder();
String currentLine;
while ((currentLine = br.readLine()) != null) {
website.append(currentLine);
}
return website.toString();
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}

(感谢 Jon Skeet 帮助我将其读取为 UTF-8),在我阅读文件后,我将一些评论替换为正确的数据(例如:我有这样的评论:<!--username-->,我将其替换它带有“Itay”),替换后我只发送响应。

服务器本身使用 sun 的 HttpServer 托管。

我还确保做了这些事情:

  • 我将 html 文件保存为 UTF-8
  • 在 html 文件中有这个元标记:<meta charset="UTF-8">"
  • 其中一个响应 header 是:Content-Type=text/html;charset=utf-8

顺便说一句,我正在使用 Chrome。

所以我希望我提供了有关我的问题的足够详细信息,如果您需要更多信息,请随时告诉我!

(我也希望我用正确的标签和标题发布了问题)

最佳答案

基本上,不要使用 FileReader。它总是使用平台默认编码,这可能不适合此文件。

如果您使用的是现代版本的 Java,最好使用:

Path path = Paths.get(System.getProperty("user.dir"), "htmlTemplate", lang, page + ".html");
br = Files.newBufferedReader(path);

这将默认以 UTF-8 读取 - 如果您想要不同的字符集,您可以将其指定为 newBufferedReader 的另一个参数。

我还建议您使用 try-with-resources 语句通过手动 finally block 摆脱所有麻烦:

Path path = Paths.get(System.getProperty("user.dir"), "htmlTemplate", lang, page + ".html");
try (BufferedReader br = Files.newBufferedReader(path)) {
StringBuilder website = new StringBuilder();
String currentLine;
while ((currentLine = br.readLine()) != null) {
website.append(currentLine);
}
return website.toString();
}

请注意,这将删除所有换行符。 (请注意,我使用了 StringBuilder 来避免重复字符串连接引起的性能问题...)

关于java - 网站中的希伯来语渲染,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31148153/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com