作者热门文章
- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在使用 HtmlCleaner 库以在 java 中解析/转换 HTML 文件。
似乎无法处理像“ÁáÉéÍíÚúÜü”这样的西类牙字符
我可以在 HtmlCleaner 中设置任何属性来处理这个或任何其他解决方案吗?这是我用来调用它的代码:
CleanerProperties props = new CleanerProperties();
props.setRecognizeUnicodeChars(true);
java.io.File file = new java.io.File("C:\\example.html");
TagNode tagNode = new HtmlCleaner(props).clean(file);
最佳答案
HtmlCleaner 除非指定,否则使用从 JVM 读取的默认字符集。在 Windows 上,这将是 Cp1512 而不是 UTF-8,这可能是它出错的地方。
你可以
-Dfile.encoding=UTF-8
使用接受字符集的 HtmlCleaner.clean()
重载
TagNode tagNode = new HtmlCleaner(props).clean(file, "UTF-8");
(如果项目中有 Google Guava,则可以使用 Charsets.UTF_8
作为常量)
HtmlCleaner.clean()
重载来接受您已经使用正确字符集构建的 InputStreamReader。关于java - HTMLCLEANER 处理西类牙字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10299651/
我是 Android 的新手,我想根据我的相机获取方向。如何根据我的相机获取方向信息?你能给出一个想法吗? 最佳答案 TYPE_ORIENTATION 已弃用 我们不能再使用方向传感器了,我们可以串联
我想知道矩阵除对角线之外的 4 个主要区域的条件。 例如下面的矩阵 A=[1,2,3,4,5; 6,7,8,9,10; 11,12,13,14,15; 16,17,18,19,20;
let latitude: = 36.6839559; let longitude = 3.6217802; 此API需要东西南北参数 const API = `http://api.geonames
我是一名优秀的程序员,十分优秀!