gpt4 book ai didi

c# - 正则表达式删除由空格分隔的连续 1-2 个字符集

转载 作者:行者123 更新时间:2023-12-02 22:44:07 26 4
gpt4 key购买 nike

我的正则表达式受损,所以我为此深表歉意,并提前感谢任何能帮助我解决这个问题的人。

我有如下文字:

real text that i want to keep i e 2 2 1 i h i i i E h i L h R 9 more real text
i e 1 i tr L h R 1 i L ? i j 1 more real text that i want to keep d i j 0 etc...

您可以看到出现的“垃圾”文本部分 - 这些是我想要删除的部分。我不一定要寻找 100% 的准确性,但我想要一个可以摆脱大部分这些部分的正则表达式。我认为垃圾文本是一个或两个字符连续出现四次或更多次,后跟一个空格的任何部分。

如标签中所述,我正在使用 C#。再次感谢。

最佳答案

是这样的吗?

\b(.{1,2}\s){4,}

如果您知道允许使用哪些字符,显然可以用句号/句点代替更精确的匹配。

关于c# - 正则表达式删除由空格分隔的连续 1-2 个字符集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10316867/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com