Python Regex 更长的连字符和前面的字母-6ren

Python Regex 更长的连字符和前面的字母

转载作者：行者123 更新时间：2023-12-04 15:10:09

25

4

我有一个 DataFrame，其中一些值存储为“Miami–Fort Lauderdale”和“Minneapolis–Saint Paul”，带有较长的连字符“–”(不是短破折号“-”)。我试图在 Windows 命令提示符下使用正则表达式删除它们，但它无法正常工作。

直接输入下面的连字符是行不通的(werid enough):

XXX.replace(to_replace=r'\–', value=' ', regex=True)

XXX.replace(to_replace='–', value=' ')

并给出不变的“迈阿密-劳德代尔堡”和“明尼阿波利斯-圣保罗”。因此，我想出于某种原因 cmd 无法识别连字符。

一般的形式是“小写字母+连字符+大写字母”所以我也试过了

XXX.replace(to_replace=r'(?=[a-z]+)\W(?=[A-Z]+)', value=' ', regex=True)

有趣的是，这给出了不变的“迈阿密-劳德代尔堡”和“明尼阿波利斯-圣保罗”

但是，下面的方法会起作用

XXX.replace(to_replace=r'\W(?=[A-Z]+)', value=' ', regex=True)

并给出所需的“迈阿密劳德代尔堡”和“明尼阿波利斯圣保罗”。但问题在于，这会扰乱其他值，例如“华盛顿特区”。进入“华盛顿特区”。 (显然)。

============================================= ======

我最终解决了这个问题

XXX.replace(to_replace=r'\W(?=\w+\s)', value=' ', regex=True)

但我仍然想知道正则表达式如何识别连字符“–”之前的字母。在我看来，好像出于某种原因，连字符之前的字母不被视为字母？

最佳答案

我建议使用

.replace(to_replace=r'(?<=[a-z])[^\w\s](?=[A-Z])', value=' ', regex=True)

这里，

(?<=[a-z]) - 与紧接在前面的小写 ASCII 字母匹配的位置的正后视
[^\w\s] - 除了单词和空白字符以外的字符
(?=[A-Z]) - 与紧跟大写 ASCII 字母的位置匹配的正前瞻。

参见 regex demo online .

另外，请注意 \w匹配一个下划线，它也是一个标点符号。如果您需要在此处“包含”它，则需要进行替换:

(?<=[a-z])(?:[^\w\s]|_)(?=[A-Z])

关于Python Regex 更长的连字符和前面的字母，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65354883/

25

4

0

文章推荐： python - 找到列中的值与列表 Python 中的值不匹配的行

文章推荐： android - 延迟发布(审核成功后无具体日期) AppGallery Connect

python代码第一行语句前面
很高兴和你分享一些有关写python代码的经验，简直就像是品尝一口甜甜的草莓冰淇淋。每当我开始写python代码的时候，就仿佛是开启了一段奇妙的冒险，每一行代码都是我的剧情发展，每一个bug都是我的挑
sql - 不清楚 LAST_VALUE - 前面
我有一张看起来像这样的 table ， Date Value 01/01/2010 03:59:00 324.44 01/02/2010 09:31:00
python - Pandas :如何在散点图中绘制一条线并将其带到后面/前面？
我已尽我所能检查但未找到任何 kwds允许您在 y=a-x 上画一条线(例如 pandas )散点图(不一定是最佳拟合线)并将其带到后面(或前面)。 #the data frame ax=df.plo
python - Pandas :如何在散点图中绘制一条线并将其带到后面/前面？
我已尽我所能检查但未找到任何 kwds允许您在 y=a-x 上画一条线(例如 pandas )散点图(不一定是最佳拟合线)并将其带到后面(或前面)。 #the data frame ax=df.plo
javascript 放在 head 前面？
我正在尝试在书签中使用 jquery UI 作为 slider 。并且 jquery ui 要求在普通 jquery 文件之后包含该文件。所以到目前为止我所尝试的只是将脚本附加到 header ，同
javascript - 将下一个元素添加到 div 前面
我正在尝试将 div (.portrait_text) 添加到容器 (.gallery_container) 中: 每个图像都会添加到其相应的 .gallery_container 前面。但我也想将
c++ - 有没有办法可以将字符串数组成员放在 ".structurevariable"前面？
因此，为了避免让自己头疼(反而制造头疼)，我试图将一个字符串数组成员放在同名的结构变量前面，但它不起作用并给我一个错误:std::string {aka class std::basic_string
html - 如何将下拉菜单放在 slider 前面
嗨，我的索引页面上的下拉菜单有问题，下拉元素隐藏在我的图像 slider 下方，它位于我的导航栏正下方，我希望能够看到下拉菜单元素，任何帮助将不胜感激非常感谢；这是我的导航栏 html:
html - 将按钮移到 Div 前面
我想在 div 前面移动一个按钮。 http://demo.gbaus.com/index.html在网站中，获取报价按钮不可点击，除非您点击最底部。我希望将它移到前面，以便您可以单击它。 posot
c++ - 循环到 map 前面
我有一个以时隙为键的 map ，指向分配的客户。并非所有时隙都有指定的客户，它可能既稀疏又密集，所以我坚持使用 map。执行。如果存在分配，则仅存在键。计数器从槽 1 计数到槽 x，并在每个槽检查分
ios - 将容器置于 View 前面
我有三个 Controller 。一个是 HomeViewController 启动 BlahPageViewController 并且它是单独的页面。其他两个 Controller (BlahPag
jquery 添加到 textarea text() 前面
我有一个文本区域。我可以设置它的文本 $("#mytextarea").text("foo") 我可以像这样添加到文本区域: $("#mytextarea").prepend("foo") 但是我不能
r - 在数据后面绘制网格，而不是在 R 前面
我喜欢在绘图时生成我自己的网格线，这样我就可以控制刻度线等，我正在用“hist”绘图程序来解决这个问题。 hist(WindSpeed, breaks=c(0:31), freq=TRUE,
.net - 您发现自己经常在类(class)前面/附加哪些名字？
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
java - 在Java中发送电子邮件将 '>'字符放在单词 "From"前面
当我用 Java 发送电子邮件时，如果单词“From”是任何行的第一个单词，则在该单词的开头附加一个“>”字符，我该如何阻止这种情况？这是我的文字: The following transactio
jquery - 将文本添加到 jQuery (this).text 前面
我有这一行输出 span 标记的名称值: $(this).text($(this).attr("name")); 在“名称”值之前添加字符(特别是美元符号 ($))的最佳方式是什么。最佳答案尝试:
ios - Swift:将选项卡栏放在 View 前面
在我调用 segue 返回到以前的 View Controller 之一后，我一直在努力解决我的选项卡栏被隐藏的问题。我读到，在segue之后， View 覆盖了标签栏。有没有办法将标签栏放在 Vi
java - JLabel 位于 JSplitPane 前面
我的目标是有一个窗口，其中背景有 2 个不同颜色的面板。它们各自覆盖屏幕的特定百分比，并且会定期变化。我通过创建一个 JSplitPane 来做到这一点。但现在我想添加一个 JLabel 在屏幕中间的
android - 导航栏 - 滚动时不会在 body 前面
我试图让我的导航栏在滚动时出现在正文的顶部。目前它在下面，如图所示。我还有一个抽屉导航，它在引入 ScrollView 后就停止工作了……我觉得这可能是因为当我单击“汉堡包”图标时，它实际上位于 S
android - 我如何将域放在 AWS ESB 前面
我之前问过类似的问题，但可能不清楚。我有一个在 Amazon Elastic beanstalk 上运行的 Web 服务 (tomcat 8)，它运行良好。然后我在 DomainA.com 上运行网

首页

博学

6Ren·AI

商城

Python Regex 更长的连字符和前面的字母