gpt4 book ai didi

java - 维基百科正则表达式匹配和替换

转载 作者:行者123 更新时间:2023-12-01 14:41:54 25 4
gpt4 key购买 nike

我正在研究维基百科提供的媒体维基 xml,并尝试对数据进行预处理,删除和替换文本中的一些特定表达式。其中一种预处理是替换维基百科页面的所有内部链接,如下 -

输入 -

text here [[foo|bar]] text here [[some.jpg|some|this is an image of some]] text here

输出 -

text here foo bar text here some.jpg some this is an image of some text here

这就是我目前能够实现的目标 -

String regex = "(\\[\\[(.+?)\\]\\]*)"; 
string.replaceAll(regex, "$2"));

这有助于我从文本中删除 [[]]。但我在尝试用空格 "" 替换管道 "|" 时遇到了困难。

感谢任何帮助。

最佳答案

如果您只想清理一组特殊字符,只需匹配这些字符即可

string.replaceAll("[\\[\\]\\|\\s]+", " ");

关于java - 维基百科正则表达式匹配和替换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15867619/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com