gpt4 book ai didi

java - 根据规则解析字符串内容的库

转载 作者:行者123 更新时间:2023-12-01 14:08:04 24 4
gpt4 key购买 nike

我想将自定义逻辑/类添加到我的自定义 Jackson JsonSerialize 实现中,以便它根据某些规则解析 html。例如,如果 html 用单引号括起来 '<b>'text'</b>'那么自定义逻辑应该按原样接受字符串。如果不是单引号,例如 <b>text</b>然后我希望自定义逻辑/类仅返回文本。另外,如果我有一个用三个单引号括起来的 html block '''<html><head><title>example</title></head></html>'''它应该按原样接受,但如果不是,则只应返回示例文本,并解析其他所有内容。实现这一目标的最佳 Java 库是什么?我考虑过使用 AnitSamy,但这让我容易受到 XSS 攻击,因为我需要接受引号内的任何内容。

示例:

input:<b>text</b>
output:text

input:'<b>'text'</b>'
output:'<b>'text'</b>'

input:<html><head><title>text</title></head></html>
output:text

input:'''<html><head><title>text</title></head></html>'''
output:'''<html><head><title>text</title></head></html>'''

最佳答案

您可以使用 Java Regex 引擎来查找模式。例如:

p = Pattern.compile("'''[\\w*]'''");
m = p.matcher(input);
if(m.find()){
//Do some logic
}

以下是 Java Regex 网站的链接: http://www.regular-expressions.info/java.html

关于java - 根据规则解析字符串内容的库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18751269/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com