gpt4 book ai didi

python - 如何只保留字母数字和空格,同时忽略非 ASCII?

转载 作者:太空宇宙 更新时间:2023-11-04 07:50:10 26 4
gpt4 key购买 nike

我有这一行来删除除空格之外的所有非字母数字字符

re.sub(r'\W+', '', s)

尽管如此,它仍然保留非英文字符。

例如如果我有

re.sub(r'\W+', '', 'This is a sentence, and here are non-english 托利 苏 !!11')

我想得到输出:

> 'This is a sentence and here are non-english  11'

最佳答案

re.sub(r'[^A-Za-z0-9 ]+', '', s)

(编辑)澄清:[] 创建一个字符列表。 ^ 否定列表。 A-Za-z 是英文字母, 是空格。对于其中的任何一个或多个(即不是 A-Z、a-z 或空格的任何内容)替换为空字符串。

关于python - 如何只保留字母数字和空格,同时忽略非 ASCII?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55902042/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com