gpt4 book ai didi

c# - 从字符串中转义\x

转载 作者:行者123 更新时间:2023-11-30 13:04:22 26 4
gpt4 key购买 nike

好吧,我得到了这个小方法:

static string escapeString(string str) {
string s = str.Replace(@"\r", "\r").Replace(@"\n", "\n").Replace(@"\t", "\t");
Regex regex = new Regex(@"\\x(..)");
var matches = regex.Matches(s);
foreach (Match match in matches) {
s = s.Replace(match.Value, ((char)Convert.ToByte(match.Value.Replace(@"\x", ""), 16)).ToString());
}

return s;
}

它替换了我在 args[0] 中得到的字符串中的“\x65”。

但我的问题是:“\\x65”也会被替换,所以我得到“\e”。我试图找出一个正则表达式来检查是否有超过一个反斜杠,但我没有运气。

有人可以给我提示吗?

最佳答案

您可以继续破解正则表达式以及诸如“\s|\w\x(..)”之类的内容以删除\x65 的大小写。显然这会很脆弱,因为不能保证您的序列\x65 前面总是有一个空格或字符。它可能是文件的开头。此外,您的正则表达式将匹配\xTT,这显然不是 unicode。考虑更换 '.'使用像“\x([0-9a-f]{2})”这样的字符类。

如果这是一个学校项目,我会做类似下面的事情。您可以将“\”的所有组合替换为另一个不太可能的序列,例如“@!!@!!@”,运行正则表达式和替换,然后将所有不太可能的序列替换回“\”。例如:

String s = inputString.Replace(@"\\", @"_@!!@!!@_");
// do all of the regex, replacements, etc here
String output = s.Replace(@"_@!!@!!@_", @"\");

但是,您不应该在生产代码中这样做,因为如果您的输入流有神奇的序列,那么您将获得额外的反斜杠。

很明显,您正在编写一种插值器。我觉得有义务推荐研究一些更强大的东西,比如使用正则表达式形成有限状态机的词法分析器。 Wiki 有一些关于这个主题的很棒的文章,我是 ANTLR 的忠实粉丝。现在可能是过度设计,但如果您不断遇到这些特殊情况,请考虑以更通用的方式解决您的问题。

从这里开始阅读理论:http://en.wikipedia.org/wiki/Lexical_analysis

关于c# - 从字符串中转义\x,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9569416/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com