gpt4 book ai didi

regex - 正则表达式从nuget包文件名中解析包名称和版本号

转载 作者:行者123 更新时间:2023-12-04 17:30:17 25 4
gpt4 key购买 nike

我有一个从nuget.org下载的nuget软件包目录。我正在尝试创建一个正则表达式,它将从文件名中解析出软件包名称和版本号。乍一看似乎并不困难;文件名具有清晰的模式:
{PackageName}.{VersionNumber}.nupkg
边缘情况使它具有挑战性。

  • 程序包名称可以包含破折号,下划线和数字
  • 程序包名称可以有效地无限制地由点分隔
  • 版本号由3-4组数字组成,以点分隔
  • 版本号有时带有预发行标签(-alpha,-beta等)后缀


    这是nuget包文件名的示例列表:
    knockoutjs.3.4.2.nupkg
    log4net.2.0.8.nupkg
    runtime.tizen.4.0.0-armel.microsoft.netcore.jit.2.0.0.nupkg
    nuget.core.2.7.0-alpha.nupkg
    microsoft.identitymodel.6.1.7600.16394.nupkg

    我希望能够在“严重文本编辑器”中进行搜索/替换,其中“搜索”是一个具有两个组的正则表达式,一个用于程序包名称,一个用于版本号。输出应为“包:\1版本:\2”。使用上面的5个软件包,输出应为:
    Package: knockoutjs Version: 3.4.2
    Package: log4net Version: 2.0.8
    Package: runtime.tizen.4.0.0-armel.microsoft.netcore.jit Version: 2.0.0
    Package: nuget.core Version: 2.7.0-alpha
    Package: microsoft.identitymodel Version: 6.1.7600.16394

    我想出的最接近的相对简洁的正则表达式是:
    ^([^\s]*)\.((?:[0-9]+\.){3,})nupkg$

    ...这将产生以下输出:
    Package: knockoutjs Version: 3.4.2.
    Package: log4net Version: 2.0.8.
    Package: runtime.tizen.4.0.0-armel.microsoft.netcore.jit Version: 2.0.0.
    nuget.core.2.7.0-alpha.nupkg
    Package: microsoft.identitymodel.6 Version: 1.7600.16394.

    它可以很好地处理前三个问题,尽管我不希望该结尾点出现。它甚至在第四个版本上都不匹配,并且第五个版本的第一部分的版本号与软件包名称集中在一起。

    Save the day!

  • 最佳答案

    我将您的表情稍作修改为:

    ^(.*?)\.((?:\.?[0-9]+){3,}(?:[-a-z]+)?)\.nupkg$

    要点是,我将 .移动到了第一个非捕获组中的数字前面,并且在第四个字符串中为 -alpha添加了一个可选的非捕获组。

    用。。。来代替:
    Package: \1 Version: \2

    测试正则表达式live here

    关于regex - 正则表达式从nuget包文件名中解析包名称和版本号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51662737/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com