gpt4 book ai didi

mysql - Solr DataImport 编码

转载 作者:行者123 更新时间:2023-11-30 23:28:26 25 4
gpt4 key购买 nike

我的 data-config.xml 看起来像这样。文件编码为带BOM的UTF-8。

<?xml version="1.0" encoding="UTF-8"?>
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://192.168.0.2/dasaran_old"
user="root"
password=""
encoding="UTF-8"/>
<document>
<entity name="user"
query="SELECT CONCAT_WS('_', 1, u.`id`) AS id, u.`id` AS entity_id, 1 AS entity_type, fullname AS title, CONCAT_WS(' ', 'Դպրոց՝ ', s.title, 'դաս.՝', cl.title) AS description FROM das_user u INNER JOIN das_ref_student_to_class_to_school sts ON u.id = sts.student_id INNER JOIN das_school s ON sts.school_id = s.id INNER JOIN das_classes cl ON sts.class_id = cl.id WHERE u.role = 'student'">
</entity>
</document>
</dataConfig>

从MySQL中提取的unicode数据是可以的。但是查询中的 unicode 字符没有作为 Unicode 插入到 Solr 索引中。

我收到这样的文档。

<doc>
<str name="description">?????? 65 ???.? 5-1</str>
<int name="entity_id">18126</int>
<int name="entity_type">1</int>
<str name="general">Ռուբեն Վարդանյան Արմենի</str>
<str name="id">[B@1bc6e3ce</str>
<str name="title">Ռուբեն Վարդանյան Արմենի</str>
</doc>

最佳答案

我不认为 data-config.xml 上的编码与 jdbc 连接上使用的编码有任何关系,您应该将其指定为 url 参数,请参阅 this question 中的详细信息

参数是:

jdbc:mysql://localhost:3306/administer?characterEncoding=utf8

关于mysql - Solr DataImport 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11952687/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com