gpt4 book ai didi

python - 如何在 Python 中的非打印 ascii 字符处拆分行

转载 作者:行者123 更新时间:2023-11-28 20:54:01 25 4
gpt4 key购买 nike

如何在 Python 中以非打印 ascii 字符(例如长减号十六进制 0x97,八进制 227)拆分一行?我不需要角色本身。其后的信息将保存为变量。

最佳答案

您可以使用 re.split .

>>> import re
>>> re.split('\W+', 'Words, words, words.')
['Words', 'words', 'words', '']

调整模式以仅包含您要保留的字符。

另请参阅:stripping-non-printable-characters-from-a-string-in-python


示例(带长减号):

>>> # \xe2\x80\x93 represents a long dash (or long minus)
>>> s = 'hello – world'
>>> s
'hello \xe2\x80\x93 world'
>>> import re
>>> re.split("\xe2\x80\x93", s)
['hello ', ' world']

或者,与 unicode 相同:

>>> # \u2013 represents a long dash, long minus or so called en-dash
>>> s = u'hello – world'
>>> s
u'hello \u2013 world'
>>> import re
>>> re.split(u"\u2013", s)
[u'hello ', u' world']

关于python - 如何在 Python 中的非打印 ascii 字符处拆分行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2936174/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com