- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想在 C# 中创建一个函数(如果需要,带有一组辅助函数),它会执行与 awk '/start/,/end/' file
类似的事情 - 除了它将包括所有最后的匹配项,而不是在第一个匹配项上终止。
假设我们有:
# cat text
"13:08:30:5276604 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:5736962 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:6227343 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:6757752 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:7208103 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:7668739 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:8129079 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
预期:
"13:08:30:6227343 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:6757752 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:7208103 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:7668739 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
AWK 输出:
# awk '/13:08:30:62/,/13:08:30:7/' text
"13:08:30:6227343 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:6757752 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
"13:08:30:7208103 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M"
我最初认为我可能只是通过两个条件得到正则表达式匹配 pattern_1 | pattern_2
但是,如果匹配值之间存在值,这将不起作用。
我还发现 C# StringBuilder 类没有 .indexOf()
和 .lastIndexOf()
方法(我在 JAVA 方面有更多经验,所以想使用这些直到我看到 C# 没有它们)。由于我没有这些方法并且可能需要实现它们,所以我想问一下这是否是可行的方法?如果需要大量搜索,本节甚至建议使用 String:MSDN - 我当然也可以使用它。我选择使用 StringBuilder 因为字符串连接是不断执行的,我应该在构建字符串时使用 stringbuilder
类型(很多连接),然后转换为 string
类型搜索?
我也希望它具有高性能,如果能听到有关如何实现它的建议,那就太棒了。一般指导和实现细节表示赞赏。
最佳答案
如果您需要处理一个潜在的大文件,您最好使用 StreamReader并使用 ReadLine 每行处理它方法。这可以防止您最终在内存中得到完整的文件,就像您在使用 StringBuilder 时可能会遇到的那样。通过使用摘要 TextReader在实现上,您可以将字符串用作(文件)流。
要检查开始和结束是否匹配,您可以使用 Regex class .这是Match方法返回一个具有 Success
属性的实例,当找到匹配项时该属性将为真。
为了实现你所追求的逻辑,我估计有三种状态:在我们找到开始之前,在我们找到结束之前,同时我们仍然找到结束。我选择通过使用 yield
在迭代器中实现它关键字,因为它几乎可以免费给我状态机。
实现如下:
void Main()
{
// use a streamreader to read characters
// the .ctor accpets an Encoding as second parameter
using(var sr = new StreamReader(@"sample.txt"))
{
ReadFromBeginToEnd("13:08:30:62","13:08:30:7",sr);
}
var text =@"
13:08:30:6227343 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M
13:08:30:6757752 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M
13:08:30:7208103 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M
13:08:30:7668739 Main: 41044 - 48.7617 M-- Other PIDS 2 - 79.1016 M";
using(var sr = new StringReader(text))
{
ReadFromBeginToEnd("13:08:30:62","13:08:30:7", sr);
}
}
// enumerate over the lines from the streamreader
// accepting two regexes, start and end
IEnumerable<string> FromBeginToEnd(TextReader rdr, Regex start, Regex end)
{
// 1st state
var line = rdr.ReadLine(); // initial read, null means we're done
// read the lines until we hit our start match
while(line != null && !start.Match(line).Success)
{
// don't return these lines
line = rdr.ReadLine();
}
// 2nd state
// read the lines while we didn't hit our end match
while(line != null && !end.Match(line).Success)
{
// return this line to the caller
yield return line;
line = rdr.ReadLine();
}
// 3rd state
// read the lines while we find our end match
while(line != null && end.Match(line).Success)
{
// return this line to the caller
yield return line;
line = rdr.ReadLine();
}
// iterator is done
yield break;
}
// take a start and end string that can be compiled to a regex
// and a file (fullpath)
void ReadFromBeginToEnd(string start, string end, TextReader reader)
{
// loop over the lines that mach the criteria
// FromBeginToEnd is our custom enumerator
foreach(var line in FromBeginToEnd(reader, new Regex(start), new Regex(end)))
{
// write to standard out
// but this can be an StreamWriter.WriteLine as well.
Console.WriteLine(line);
}
}
关于c# - 使用模式 range/start//end/搜索 String 或 StringBuilder,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45302141/
我创建了以下 sub 来简单地说明问题。我将事件工作表的范围 A2:E10 分配给范围变量。然后,对于另一个范围变量,我将这个范围的子范围,单元格 (1, 1) 分配给 (3, 3)。 我原以为这将包
我使用正则表达式来搜索以下属性返回的纯文本: namespace Microsoft.Office.Interop.Word { public class Range {
我正在开发一个宏来突出显示某些行/单元格以供进一步审查。一些值/空白将以红色突出显示,其他以橙色突出显示,而整行应为黄色。我从上一个问题中得到了一些帮助,并添加了更多细节,它工作得几乎完美,但我被困在
这个问题在这里已经有了答案: What is the difference between range and xrange functions in Python 2.X? (28 个答案) 关闭
我在尝试运行脚本时遇到这个奇怪的错误,代码似乎是正确的,但似乎 python (3) 不喜欢这部分: def function(x): if int
我正在编写一种算法,将一些数据写入提供的输出范围(问题的初始文本包括具体细节,这将评论中的讨论转向了错误的方向)。我希望它在 API 中尽可能接近标准库中的其他范围算法。 我查看了 std::rang
这按预期工作: #include #include int main() { auto chunklist = ranges::views::ints(1, 13) | ranges::vie
我这里有一个字符串,我正在尝试对其进行子字符串化。 let desc = "Hello world. Hello World." var stringRange = 1..' 的值转换为预期的参数类型
我有一个高级搜索功能,可以根据日期和时间查询记录。我想返回日期时间范围内的所有记录,然后从该范围内返回我想将结果缩小到一个小时范围(例如 2012 年 5 月 1 日 - 2012 年 5 月 7 日
Go 中的 range 函数和 range 关键字有什么区别? func main(){ s := []int{10, 20, 30, 40, 50, 60, 70, 80, 90}
如果我有一个范围,如何将其拆分为一系列连续的子范围,其中指定了子范围(存储桶)的数量?如果没有足够的元素,则应省略空桶。 例如: splitRange(1 to 6, 3) == Seq(Range(
我正在开发 VSTO Excel 项目,但在管理 Range 对象时遇到一些问题。 实际上,我需要知道当前选定的范围是否与我存储在列表中的另一个范围重叠。所以基本上,我有 2 个 Range 实例,我
在即将推出的 C++20 系列中,将有 range concept具有以下定义: template concept range = __RangeImpl; // exposition-only de
希望有人能回答我的问题。我在 VHDL 代码中遇到了这个命令,但不确定它到底做了什么。有人可以澄清以下内容吗? if ( element1 = (element1'range => '0')) the
可以将范围嵌套在范围中吗?使用范围内的变量?因为我想取得一些效果。为了说明这个问题,我有以下伪代码: for i in range(str(2**i) for i in range(1,2)):
我想在 2 个日期之间创建一个范围,并且我的范围字段有时间 damage_list = Damage.objects.filter(entry_date__range=(fdate, tdate))
在下面的代码中 #include #include #include int main() { std::unordered_mapm; m["1"]=1; m["2"]=2
我试图为我的电子表格做一个简单的循环,它循环遍历一个范围并检查该行是否为空,如果不是,则循环遍历一系列列并检查它们是否为空,如果是则它设置一个消息。 问题是每次它通过循环 ro.value 和 col
我在将一个工作簿范围中的值分配给当前工作簿中的某个范围时遇到问题。当我使用 Range("A1:C1") 分配我的范围时,此代码工作正常,但是当我使用 Range(Cells(1,1),Cells(1
我改写了原来的问题。 Sub s() Dim r As Range Set r = ActiveSheet.Range("B2:D5") Debug.Print r.Rows.Count
我是一名优秀的程序员,十分优秀!