gpt4 book ai didi

c# - 在 XML 解析器中处理非标准引号的最佳方式

转载 作者:行者123 更新时间:2023-11-30 18:33:46 27 4
gpt4 key购买 nike

<分区>

我正在创建一个程序来处理具有 XML 格式的文本。我发现当标记值是非 ASCII 引号(双引号/ASCII 34,单引号/ASCII 39)时,解析会抛出异常。此类引用可能来自Ms Word(自动格式化)等编辑软件。

目前,我在处理 XML 之前解析文本框的每一行并替换引号。这是代码(在 C# 中)

int nLines = textBox1.Lines.Length;

for (int i = 0; i < nLines; i++)
{
// get the current line and replace quotes with standard ones
line = Regex.Replace(textBox1.Lines[i], "[\u2018|\u2019|\u201A]", "'");
line = Regex.Replace(line, "[\u201C|\u201D|\u201E]", "\"");

我想知道是否有更好/更正确/更快的方法来实现这一点?我所说的更正确的方法是这样的方法应该涵盖几乎所有引号的可能性(我听说\d 可以用于 0-9 以及 unicode)。提前致谢!

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com