gpt4 book ai didi

c# - 在 C# 中拆分字符串

转载 作者:可可西里 更新时间:2023-11-01 08:17:12 32 4
gpt4 key购买 nike

我认为这将是微不足道的,但我无法让它发挥作用。

假设 CSV 文件中有一行:"Barack Obama", 48, "President", "1600 Penn Ave, Washington DC"

string[] tokens = line.split(',')

我希望这样:

 "Barack Obama"
48
"President"
"1600 Penn Ave, Washington DC"

但最后一个标记是 '华盛顿特区' 不是 “1600 Penn Ave, Washington DC”

有没有简单的方法让拆分函数忽略引号内的逗号?

我无法控制 CSV 文件,它也不会发送给我。客户 A 将使用该应用读取外部人员提供的文件。

最佳答案

您可能必须编写自己的拆分函数。

  • 遍历字符串中的每个字符
  • 当你点击一个 " 字符时,切换一个 bool 值
  • 当你碰到一个逗号时,如果 bool 为真,忽略它,否则,你有你的 token

这是一个例子:

public static class StringExtensions
{
public static string[] SplitQuoted(this string input, char separator, char quotechar)
{
List<string> tokens = new List<string>();

StringBuilder sb = new StringBuilder();
bool escaped = false;
foreach (char c in input)
{
if (c.Equals(separator) && !escaped)
{
// we have a token
tokens.Add(sb.ToString().Trim());
sb.Clear();
}
else if (c.Equals(separator) && escaped)
{
// ignore but add to string
sb.Append(c);
}
else if (c.Equals(quotechar))
{
escaped = !escaped;
sb.Append(c);
}
else
{
sb.Append(c);
}
}
tokens.Add(sb.ToString().Trim());

return tokens.ToArray();
}
}

然后调用:

string[] tokens = line.SplitQuoted(',','\"');

基准

对我的代码和丹涛的代码进行基准测试的结果如下。如果人们需要,我很乐意对任何其他解决方案进行基准测试?

代码:

string input = "\"Barak Obama\", 48, \"President\", \"1600 Penn Ave, Washington DC\""; // Console.ReadLine()
string[] tokens = null;

// run tests
DateTime start = DateTime.Now;
for (int i = 0; i < 1000000; i++)
tokens = input.SplitWithQualifier(',', '\"', false);
Console.WriteLine("1,000,000 x SplitWithQualifier = {0}ms", DateTime.Now.Subtract(start).TotalMilliseconds);

start = DateTime.Now;
for (int i = 0; i<1000000;i++)
tokens = input.SplitQuoted(',', '\"');
Console.WriteLine("1,000,000 x SplitQuoted = {0}ms", DateTime.Now.Subtract(start).TotalMilliseconds);

输出:

1,000,000 x SplitWithQualifier = 8156.25ms
1,000,000 x SplitQuoted = 2406.25ms

关于c# - 在 C# 中拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2807536/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com