gpt4 book ai didi

java - 双引号的 Solr PatternTokenizer 正则表达式

转载 作者:行者123 更新时间:2023-11-30 02:36:33 24 4
gpt4 key购买 nike

我想通过使用 PatternTokenizer 使用 "作为输入的标记分隔符。我在 schema.xml 中的设置如下

<tokenizer class="solr.PatternTokenizerFactory" pattern="[\s\.,!(){\[\]:}\"]+"/>

但是这个失败了,因为第二个 "被误认为是模式的结束(Solr 无法从它开始)。我怎样才能实现我想要的输出?

最佳答案

您需要将该行更新为

pattern="[\s.,!(){\[\]:}&quot;]+"

必须用 XML 实体替换文字引号。

作为替代方案,您可以使用 \u0022 ,正则表达式引擎将其正确解析为文字双引号。

关于java - 双引号的 Solr PatternTokenizer 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42904397/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com