gpt4 book ai didi

java - Solrj - 编码问题

转载 作者:搜寻专家 更新时间:2023-11-01 03:40:50 24 4
gpt4 key购买 nike

我有一个文档,其标题字段具有值 - Mörder(o 上有一个变音符号)。

当我使用以下方法在 Java 中获取它时,两个打印命令中返回的值都是 Morder(r 上有一个元音变音)。奇怪。

当我继续访问 Solr 提供的 Web UI 时,标题是 Mörder(o 上有一个变音符号)。

谁能告诉我哪里出了问题?

    SolrQuery query = new SolrQuery();
query.setParam("q", "<some query>");
query.setStart(start);
query.setRows(rows);
query.setFacet(false);
query.setFields("title");
QueryResponse rsp = server.query(query);

SolrDocumentList sdl = rsp.getResults();

for (SolrDocument sdOl : sdl) {
System.out.println(sdOl.getFieldValue("title"));
System.out.println(new String(sdOl.getFieldValue("title").toString().getBytes, "UTF-8"));
}

编辑

我实际上是在比较 2 个核心的文档标题。一个返回正确的变音符号,但另一个总是将变音符号移动到下一个字符。

最佳答案

Unicode 分解被大/小印度字节转换弄乱了?只是一个疯狂的(半开玩笑的)猜测。

实际上,没有答案,但我会输入 Wireshark看看客户端在问什么,服务器在回答什么。这将告诉您问题是在离开服务器时还是在到达客户端时。

我不知道您的客户端配置,但如果流量以二进制形式通过,则有一些客户端选项会将其切换为 XML。如果这本身就可以解决问题,那么问题出在 javabin 格式上。如果没有,至少你有确切的查询和响应来工作。

关于java - Solrj - 编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14817564/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com