- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试使用 .Net Core 2.1 从看起来像标记的字符串中解析键值对。
考虑下面的示例 Program.cs 文件...
我怎样才能写出模式 kvp
充当“键和值(如果存在)”而不是当前行为的“键或值”?
例如,在测试用例2的输出中,而不是:
=============================
input = <tag KEY1="vAl1">
--------------------
kvp[0] = KEY1
key = KEY1
value =
--------------------
kvp[1] = vAl1
key =
value = vAl1
=============================
我想看看:
=============================
input = <tag KEY1="vAl1">
--------------------
kvp[0] = KEY1="vAl1"
key = KEY1
value = vAl1
=============================
不破坏测试用例 9:
=============================
input = <tag noValue1 noValue2>
--------------------
kvp[0] = noValue1
key = noValue1
value =
--------------------
kvp[1] = noValue2
key = noValue2
value =
=============================
我怎样才能写出模式 value
在名为“quotes”的组匹配的下一个字符处停止匹配?换句话说,下一个平衡报价。我显然误解了反向引用的工作原理,我的理解是 \k<quotes>
将替换为运行时匹配的值(不是设计时定义的模式)由 (?<quotes>[""'`])
.
例如,在测试用例5的输出中,而不是:
--------------------
kvp[4] = key3='hello,
key =
value = key3='hello,
--------------------
kvp[5] = experts
key =
value = experts
=============================
我想看看(尽管有问题 1 的解决方案):
--------------------
kvp[4] = key3
key = key3
value =
--------------------
kvp[5] = hello, "experts"
key =
value = hello, "experts"
=============================
我怎样才能写出模式 value
在 />
之前停止匹配?在测试用例 7 中,key2
的值应该是 thing-1
.我不记得我尝试过的所有内容,但我还没有找到一种在不破坏测试用例 6 的情况下工作的模式,其中 /
是值的一部分。
using System;
using System.Reflection;
using System.Text.RegularExpressions;
namespace ConsoleApp1
{
class Program
{
static void Main(string[] args)
{
RegExTest();
Console.ReadLine();
}
static void RegExTest()
{
// Test Cases
var case1 = @"<tag>";
var case2 = @"<tag KEY1=""vAl1"">";
var case3 = @"<tag kEy2='val2'>";
var case4 = @"<tag key3=`VAL3`>";
var case5 = @"<tag key1='val1'
key2=""http://www.w3.org"" key3='hello, ""experts""'>";
var case6 = @"<tag :key1 =some/thing>";
var case7 = @"<tag key2=thing-1/>";
var case8 = @"<tag key3 = thing-2>";
var case9 = @"<tag noValue1 noValue2>";
var case10 = @"<tag/>";
var case11 = @"<tag />";
// A key may begin with a letter, underscore or colon, follow by
// zero or more of those, or numbers, periods, or dashs.
string key = @"(?<key>(?<=\s+)[a-z_:][a-z0-9_:\.-]*?(?=[\s=>]+))";
// A value may contain any character, and must be wrapped in balanced quotes (double, single,
// or back) if the value contains any quote, whitespace, equal, or greater- or less- than
// character.
string value = @"(?<value>((?<=(?<quotes>[""'`])).*?(?=\k<quotes>)|(?<=[=][\s]*)[^""'`\s=<>]+))";
// A key-value pair must contain a key,
// a value is optional
string kvp = $"(?<kvp>{key}|{value})"; // Without the | (pipe), it doesn't match any test case...
// ...value needs to be optional (case9), tried:
//kvp = $"(?<kvp>{key}{value}?)";
//kvp = $"(?<kvp>{key}({value}?))";
//kvp = $"(?<kvp>{key}({value})?)";
// ...each only matches key, but also matches value in case8 as key
Regex getKvps = new Regex(kvp, RegexOptions.IgnoreCase);
FormatMatches(getKvps.Matches(case1)); // OK
FormatMatches(getKvps.Matches(case2)); // OK
FormatMatches(getKvps.Matches(case3)); // OK
FormatMatches(getKvps.Matches(case4)); // OK
FormatMatches(getKvps.Matches(case5)); // Backreference and/or lazy qualifier doesn't work.
FormatMatches(getKvps.Matches(case6)); // OK
FormatMatches(getKvps.Matches(case7)); // The / is not part of the value.
FormatMatches(getKvps.Matches(case8)); // OK
FormatMatches(getKvps.Matches(case9)); // OK
FormatMatches(getKvps.Matches(case10)); // OK
FormatMatches(getKvps.Matches(case11)); // OK
}
static void FormatMatches(MatchCollection matches)
{
Console.WriteLine(new string('=', 78));
var _input = matches.GetType().GetField("_input",
BindingFlags.NonPublic |
BindingFlags.Instance)
.GetValue(matches);
Console.WriteLine($"input = {_input}");
Console.WriteLine();
if (matches.Count < 1)
{
Console.WriteLine("[kvp not matched]");
return;
}
for (int i = 0; i < matches.Count; i++)
{
Console.WriteLine(new string('-', 20));
Console.WriteLine($"kvp[{i}] = {matches[i].Groups["kvp"]}");
Console.WriteLine($"\t key\t=\t{matches[i].Groups["key"]}");
Console.WriteLine($"\tvalue\t=\t{matches[i].Groups["value"]}");
}
}
}
}
最佳答案
你可以使用
\s(?<key>[a-z_:][a-z0-9_:.-]*)(?:\s*=\s*(?:(?<q>[`'"])(?<value>.*?)\k<q>|(?<value>(?:(?!/>)[^\s`'"<>])+)))?
参见 regex demo突出显示组和 .NET regex demo (证明)。
C# 用法:
var pattern = @"\s(?<key>[a-z_:][a-z0-9_:.-]*)(?:\s*=\s*(?:(?<q>[`'""])(?<value>.*?)\k<q>|(?<value>(?:(?!/>)[^\s`'""<>])+)))?";
var matches = Regex.Matches(case, pattern, RegexOptions.IgnoreCase);
foreach (Match m in matches)
{
Console.WriteLine(m.Value); // The whole match
Console.WriteLine(m.Groups["key"].Value); // Group "key" value
Console.WriteLine(m.Groups["value"].Value); // Group "value" value
}
详情
\s
- 一个空格(?<key>[a-z_:][a-z0-9_:.-]*)
- 组“键”:一封信,_
或 :
然后是 0+ 个字母、数字、_
, :
, .
或 -
(?:\s*=\s*(?:(?[<code>'"])(?<value>.*?)\k<q>|(?<value>(?:(?!/>)[^\s</code>'"<>])+)))?
- 一次或零次出现(因此该值是可选的):
\s*=\s*
- 一个 =
用 0+ 个空格括起来(?:
- 非捕获组的开始:
(?[`'"])
- 分隔符,`
, '
或 "
(?<value>.*?)
- 将匹配除换行字符以外的任何 0+ 个字符的“值”分组尽可能少\k<q>
- 对组“q”的反向引用,相同的值必须匹配|
- 或者
<code>(?<value></code>(?:(?!/>)[^\s`'"<>])+)
- 组“值”:空格以外的字符,`
, '
, "
, <
和 >
,出现 1 次或多次,不会启动 />
字符序列)
- 非捕获组结束。关于c# - .Net Core 正则表达式、命名组、嵌套组、反向引用和惰性限定符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53365251/
我面临以下问题: 我有一个命名空间 Exception\* , 其中包含多种类型 异常(exception)。 我有一个命名空间 Exception\User\* ,其中包含一个 特定类型的异常 (
新的 Highcharts v3.0 气泡图看起来很棒。是否可以用名称/一些文本注释和显示每个气泡? 谢谢,奈杰尔。 最佳答案 您需要做两件事。 首先,命名每个数据点(气泡): data: [ {
我通过使用 EVP_get_cipherbyname("AES-256-CTR") 获得了 EVP_CIPHER*,现在我想找到一种方法从 EVP_CIPHER* 返回到原始名称,在本例中为“AES-
为了避免 JavaScript 堆问题,我使用多个数组:family1、family2、family3 ...、dogs1、dogs2、dogs3 ... 使用示例:“family1 和 dogs1”
我很难理解这段代码。这不是我熟悉的典型 Javascript 函数语法。这是一个命名函数吗?或者这是更新事件的回调?抱歉,我对新手问题很陌生,我对 JS 还很陌生。我了解正在发生的一切,除了这个函数语
是否可以在 python 中执行以下操作? i=1 while True: w = open("POSCAR_i","w") i=i+1 if i<10:
我问这个是因为我刚刚在一段代码上看到它: var myVar = function func(arg){ console.log(arg); } 我不明白为什么函数在为 myVar 定义之前被“
我正在尝试为 ActiveDirectory 创建上下文(客户端和服务器都是 Windows),使用我的 Windows 凭据和 NTLM。 这是我的代码: public void func() {
我正在运行一个使用 JBoss5 容器的 ejb 示例。我正在使用一个例子 from here(Part one) . 在示例中,我在 JBoss 中部署了 bean,在 Tomcat 中部署了一个应
我希望能够命名一个 BackgroundWorker 以便于调试。这可能吗? 最佳答案 我必须尝试,但你不能只设置 Name BackgroundWorker 执行的 DoWork() 方法中的线程?
我在 Android Activity 和其他类之间遇到了越来越多的命名冲突。我想知道你能不能告诉我你是如何避免这些的。遗憾的是,关于 SO 的相关问题并未涵盖我的特定命名问题。 第一个例子 我有一个
当我尝试使用 loadChildren 加载模块以在命名 socket 中加载模块的组件时,出现抛出错误。 有没有办法在命名的路由器 socket 中延迟加载模块? //html //routing
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的,无法以目前的形式得到合理的回答。如需帮助澄清这个问题以便重新打开它,visit the help center .
在 Type Driven Development with Idris 第 6 章的代码中,我对这段代码感到困惑: data DataStore : Type -> Type where M
通常,如果有一个属性可以获取/设置状态值,我会使用“Is”,例如: Visibility: .IsVisible 但是对于获取/设置操作的属性,最好使用什么?喜欢: Casting shadows:
好的,所以如果你可以很容易地想到一个名词,那么命名一个接口(interface)(或类)很容易:用户、窗口、数据库、流等。 形容词或形容词的概念呢?例如有时间戳的东西(HasTimestamp、Tim
我刚开始学习 PowerShell,我想知道 Posh 中的 cmdlet(或高级功能,无论它们在 CTP3 中称为什么)是否有一些好的动词指南。 如果我做一个get-verb,我可以看到很多。但我仍
$(".song").live('click', function songClick() { //do stuff }); 你能像上面那样命名一个函数,然后稍后再调用它吗?我尝试过,但没有成
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 可以用事实和引用来回答它. 7年前关闭。 Improve this
我的 Spring 应用程序中有两组类 - DTO 和实体。 在阅读了 Bob 叔叔的 Clean Code 之后,我比以往任何时候都更喜欢正确命名事物。 我坐下来重构我的一个 Spring 项目,但
我是一名优秀的程序员,十分优秀!