gpt4 book ai didi

c# - 使用正则表达式匹配连字符后的所有内容

转载 作者:行者123 更新时间:2023-11-30 20:52:24 24 4
gpt4 key购买 nike

我正在尝试从新闻文章中提取标题。问题是新闻网站通常会在标题后附加一个连字符和他们的公司名称,所以我试图制作一个正则表达式来匹配空格、连字符、空格及其后的所有内容。例如:

“我的世界 - Xbox 360 版” future 混搭包和 Xbox One 更新已发布 - 国家视频游戏新闻

匹配

- 国家电子游戏新闻

我想让正则表达式匹配空格 + 连字符 + 空格及其后的所有内容,前提是它之后的所有内容最多包含 4 个以大写字母开头的单词。我尝试使用否定前瞻来排除以小写字母开头的单词:

\s-\s(?!([a-z]+\s){3,}[a-z]+).*

但它匹配空格、第一个连字符及其后的所有内容:

- Xbox 360 版的 future 混搭包和 Xbox One 更新已发布 - National Video Game News

我不知道该怎么做,有人可以帮忙吗?

最佳答案

为什么不直接用没有负前瞻的正常方式写呢?

\s-(\s[A-Z][a-z]+){0,4}$

关于c# - 使用正则表达式匹配连字符后的所有内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20941759/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com