regex - 在大写字母前插入空格但不在缩写之间插入空格的 pythonic 方法-6ren

regex - 在大写字母前插入空格但不在缩写之间插入空格的 pythonic 方法

转载作者：行者123 更新时间：2023-12-02 02:44:25

24

4

我有一个文件，我正在通过 python 脚本更改其格式。我在这个文件中有几个驼峰式字符串，我只想在大写字母前插入一个空格 - 所以“WordWordWord”变成“Word Word Word”，但我也有一些缩写，比如文本“General Manager or副总裁”。

我在这篇文章中找到了 David Underhill 的回答:

A pythonic way to insert a space before capital letters

虽然这个答案帮助我不要在文本中的缩写之间插入空格，例如“DaveIsAFKRightNow!Cool”

但它肯定会在“VP”中的 V 和 P 之间插入一个空格。

我只有 25 点经验，我无法对现有帖子发表评论，我别无选择，只能为此类类似问题创建另一个帖子。

我不太擅长 RegEx，也不知道如何处理这种情况。

我试过这个:

re_outer = re.compile(r'([^A-Z ])([A-Z])')
re_inner = re.compile(r'(?<!^)([A-Z])([^A-Z])')
re_outer.sub(r'\1 \2', re_inner.sub(r' \1\2', 'DaveIsAFKRightNow!Cool'))

它给了我‘戴夫现在离开了!酷'

我的文本示例是这样的:

General Manager or VP Torrance, CARequired education

我希望输出为:General Manager or VP Torrance, CA Required education

我得到的输出是:General Manager or V P Torrance, CA Required education

最佳答案

您可以交换替换以首先在大写字母之前插入空格，这些字母前面是除大写字母和空格之外的字符，然后在以 1+ 个大写字母开头，后跟一个大写字母和一个小写字母的单词之前附加一个空格信件:

import re
re_outer = re.compile(r'([^A-Z ])([A-Z])')
re_inner = re.compile(r'\b[A-Z]+(?=[A-Z][a-z])')
print(re_inner.sub(r'\g<0> ', re_outer.sub(r'\1 \2', 'DaveIsAFKRightNow!Cool')))
# => Dave Is AFK Right Now! Cool
print(re_inner.sub(r'\g<0> ', re_outer.sub(r'\1 \2', 'General Manager or VP Torrance, CARequired education'))) 
# => General Manager or VP Torrance, CA Required education

参见 Python demo

\b[A-Z]+(?=[A-Z][a-z])正则表达式匹配

\b - 单词边界
[A-Z]+ - 1+ 个大写字母是
(?=[A-Z][a-z]) - 后跟一个大写字母和一个小写字母。

请注意 \g<0>在替换模式中插入整个匹配项。

关于regex - 在大写字母前插入空格但不在缩写之间插入空格的 pythonic 方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56342930/

24

4

0

文章推荐： regex - 正则表达式用于分割字符串

文章推荐： laravel - GuzzleHttp\Client JSON 作为字符串返回

文章推荐： java - 在服务器启动时加载/初始化 Java servlet

文章推荐： java - 从对象填充表 Javafx

c++ - 大写字母
我遇到了一个小问题。我想利用字符串中的双字母。我设法编译了一个程序，但没有成功。 #include #include #include std::string::iterator functio
javascript - 如何使文本字段中的所有内容都是大写字母/大写字母？
我想让我在文本字段中写的所有内容都是大写字母。在我写作时，而不是在失去焦点之后。我如何使用 jQuery 做到这一点？最佳答案我会为此使用 CSS。只需将 text-transform: up
asp实现生成由数字，大写字母，小写字母指定位数的随机数
<% '****************************** '函数：gen_key(digits)&nb
javascript - 使用jquery限制用户在文本框中插入空格、大写字母、第一个值作为int
我有一个表单，我希望用户只输入字母、数字我想限制他们使用数字作为第一个值例如。 1abc 使用大写字母1ABc 使用空格1 ab CD d5 我只想要abc1 OR a1bc OR f25fhg
c - 如何用C生成随机字母(大写字母)并保存到文本文件中？
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
mysql - 恢复数据库后保持MySQL数据库 View 大写字母
恢复MySQL数据库后，我可以保留所有大写字母名称的表。但 View 名称改为小写字母。我可以更改一些设置以使 View 在恢复数据库后保留大写字母名称吗？附注我可以在恢复后再次将 View 更改
mysql - 更好地理解查询中的 MySQL 大写字母
总的来说，我是 PDO 和 MySQL 的新手。我正在从即将弃用的 MySQL 切换到 PDO，我有一些问题想更好地了解 MySQL 查询的工作原理。我目前有这个功能，我不明白表格行前的大写U.&M
Javascript正则表达式 - 匹配单词中间的大写/大写字母(在句子中)？
仅当所有大写字母位于单词中间时，我才需要匹配它们。例如，RegExr 将与字母 E 匹配。 someThings 代表字母 T。如果大写字母从单词的开头开始，则它不应该匹配。这个正则表达式几乎匹配它
java - 如何查找字符串中连续双字母(大写字母)的数量？
这个问题已经有答案了: What causes a java.lang.ArrayIndexOutOfBoundsException and how do I prevent it? (25 个回答)
c - 字符串 - 名字和姓氏按字母顺序排列，大写字母
我需要按字母顺序相应地排列名称。我设法获得了所需的输出。但是，当我用第一个大写字母键入名称时，例如:Peter，输出是不同的。 EG 输入:Peter Paul John Mary EG 输出:第一个
java - 如何检查字符串是否包含小写字母、大写字母、特殊字符和数字？
我一直在谷歌上搜索，但没有找到我的问题的答案: 如何使用正则表达式检查字符串是否至少包含以下各项: 大写字母小写字母数字特殊字符:~`!@#$%^&*()-_=+\|[{]};:'",/? 所以
Excel 数据验证数字、字母、数字(大写字母)
所以我找到了一个适用于数字然后字母的代码，我尝试修改，以便用户在单元格中输入数据需要是 ex:"52TSQ1234512345" 。我知道他们必须输入 ex: "12PQS" (数字和字母是示例，它可
JavaScript:如何从字符串中删除任何包含(或直接位于其前面)大写字母、数字或逗号的单词？
我正在尝试编写代码，以便从字符串(文本)中删除“坏”单词。如果该词后面有逗号或任何特殊符号，则该词是“坏”的。如果该单词仅包含 a 到 z(小写字母)，则该单词并不“坏”。所以，我想要达到的结果是
c++ - std::_Atomic_thread_fence(大写字母 A)是否正确？
Visual Studio 2012 c++ 文档指出 _ReadBarrier和 _WriteBarrier内在函数现在是 deprecated: The _ReadBarrier, _WriteB
php - 浏览器不显示 .JPG 文件(大写字母)
在我的站点中，我提供了一个选项来上传带有 .jpg 和 .JPG 扩展名的图像。它们都可以工作，我可以在服务器本身上看到它们。当我尝试在浏览器中查看带有 .jpg 扩展名的照片时，将它们命名为 na
ascii - 在没有 ctype.h 的情况下转换小写/大写字母
我刚刚看到这在技术上是可行的，我无法解决的唯一错误是每次测试时打印的最后一个 ASCII 字符，我也在不使用的情况下进行了测试。姓名变量，我的意思是在 ASCII 中的任何小写字母减去 32 应该
clojure - 如何判断一个字符是否是 Clojure 中的 ASCII 大写字母
我得到了这样的序列: (\$ \# \A \( \* \& \9 \8 \7 \Z \f) 我想过滤掉其中的大写 ASCII 字母，如\A 和\Z 我试图在标准库中查找，但没有运气。有谁能够帮助我？
c# - 检查字符串是否至少包含每个 : lowercase letter, 大写字母、数字和特殊字符之一
我已经搜索过 SO 和 Google，我发现的大多数示例似乎都没有按预期工作(或者没有结合所有这些元素)。我正在尝试创建一个 Regex 表达式，如果字符串包含至少字符串中的以下 anywhere
mysql - php 查询(小写/大写字母)验证
我需要从 mysql 中选择有关查询字符串的结果。让我们的字符串是:Z 和 z(大写和小写) 数据库的样子: url_id test_char 1 Z 2
windows - 大写字母 "S"在 Windows 浏览器中突然出现缩进 - 为什么？
到目前为止，我们在任何地方都没有发现关于这种非常奇怪的效果的信息。有一段时间(不知 Prop 体从什么时候开始)，大写字母 S 在 Windows 浏览器中的呈现就像它向右移动了一两个像素一样。这

首页

博学

6Ren·AI

商城

regex - 在大写字母前插入空格但不在缩写之间插入空格的 pythonic 方法