gpt4 book ai didi

python - 从字符串中删除特殊字符,例如笑脸,但保留德语特殊字符

转载 作者:行者123 更新时间:2023-11-30 22:22:35 24 4
gpt4 key购买 nike

我知道如何删除字符串中不需要的字符,例如笑脸等。但是,某些语言(例如德语)也有特殊字符。

这是我当前的代码:

import unicodedata
string = "süß 😆😋😉"
uni_str = str(unicodedata.normalize('NFKD', \
string).encode('ascii','ignore'))

是否有可能保留德语特殊字符而删除其他不需要的字符,例如像😆😋😉这样的笑脸?这样 uni_str 将在末尾保留字母“süß”?

目前,表情符号将被删除,但德语字符也将被转换为其他声音或删除。

示例中的笑脸只是示例性的,可以是任何类型的不需要的字符。

我使用的是 Python 3.6 和 Windows 10

最佳答案

您可以做这样简单的事情(只需添加德文字母):

def filter_characters(self, value):
allowed_characters = " 0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
return ''.join(c for c in value if c in allowed_characters )

编辑:

另一种可能性是在字符串模块的帮助下创建 allowed_characters:

import string
allowed_characters = string.printable + 'öäüß'

关于python - 从字符串中删除特殊字符,例如笑脸,但保留德语特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48270460/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com