python - 当字符落在 unicode 范围之间时如何用空格填充字符？-6ren

python - 当字符落在 unicode 范围之间时如何用空格填充字符？

转载作者：太空宇宙更新时间：2023-11-04 02:39:17

25

4

目标是在满足 issubset 条件时用空格填充字符，例如

[在]:

subset = [chr(ordinal) for ordinal in range(ord(u'\u31c0'), ord(u'\u31ef'))]

text = '这是个小㇈㇋伙子'

[输出]:

output_text = '这是个小 ㇈ ㇋ 伙子'

我可以这样做:

def issubset(uchar):
    if u'\u31c0' <= uchar <= u'\u31ef':
        return True
    return False

def pad_space_ifsubset(text):
    output = ""
    for ch in text:
        if issubset(ch):
            output +=  " " + ch + " "
        else:
            output += ch
    return output

text = '这是个小㇈㇋伙子'

pad_space_ifsubset(text)

但是有没有更简单的方法来做到这一点？也许用正则表达式？

最佳答案

您可以使用 re.sub 在感兴趣的代码点上使用范围模式，并在替换字符串中使用组反向引用(\g<0> 将替换匹配的整个子字符串，或者在这种情况下，替换范围中的单个字符):

import re

def pad_space_ifsubset(text):
    return re.sub(u'[\u31c0-\u31ef]', ' \g<0> ', text)

例如:

>>> text = u'这是个小㇈㇋伙子'
>>> print pad_space_ifsubset(text)
这是个小 ㇈  ㇋ 伙子

关于python - 当字符落在 unicode 范围之间时如何用空格填充字符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47006311/

25

4

0

文章推荐： javascript - Nodejs 中 undefined variable 无法显示错误

文章推荐：用 ifort 和 icc 编译和链接 Fortran 和 C

文章推荐： android - 使用 CLI 在 Titanium Studio 中手动构建 APK

文章推荐： python - 如何删除 Countvectorizer 中存在的数字字符？

javascript - LatLong 落在 D3 + Leaflet 中的给定多边形内
我正在尝试学习如何使用 Javascript 库 leaflet连同 d3创建各种 map 可视化效果。我一直在关注this tutorial它创建了具有一定交互性的美国等高线 map 。这提供了一
css - Webpack 落在@-webkit-keyframes 通过
我对来自 https://github.com/felixrieseberg/React-Dropzone-Component 的 Webpack 和 React dropzone 插件有疑问我使用
database - MapR-DB 落在 CAP 定理的什么地方？
考虑到 MapR-DB 是一个分布式数据库，它要么属于“CP”类别，要么属于“AP”类别。最佳答案引自http://maprdocs.mapr.com/home/MapROverview/c_ma
html - 折叠到一列时如何让右侧的 div 落在 Foundation 中的左侧 div 之上
我正在 Zurb 的 Foundation 4 中构建一个站点。我有一个包含两列的行。左栏是段落，右栏是图像。当我将浏览器缩小到移动尺寸以便布局折叠成一列时，我希望右侧的 div(图像)在转换为一列时

首页

博学

6Ren·AI

商城

python - 当字符落在 unicode 范围之间时如何用空格填充字符？