gpt4 book ai didi

python - 从字符串中删除特殊字符

转载 作者:太空狗 更新时间:2023-10-29 18:21:32 25 4
gpt4 key购买 nike

我有一个字符串“Mikael Håfström”,其中包含一些特殊字符,如何使用 python 删除它?

最佳答案

您可以使用 unicodedata标准化 unicode 字符串并将它们编码为 ASCII 形式的模块,如下所示:

>>> import unicodedata
>>> source = u'Mikael Håfström'
>>> unicodedata.normalize('NFKD', source).encode('ascii', 'ignore')
'Mikael Hafstrom'

一个值得注意的异常(exception)是字母“đ”和“Đ”无法被 Python 识别,并且它们不会被编码为“d”,因此它们只会从结果中被忽略。这是一些 SEE 语言的拉丁字母表中出现的浊齿龈-腭塞擦音,因此根据您的听众或您是否提供对 Latin-1 字符集的全面支持,它可能会或可能不会立即引起您的关注。我目前在本地运行 Python 2.6.5(2010 年 3 月 19 日)并且存在问题,但我确信它可能已通过较新版本得到解决。

关于python - 从字符串中删除特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5258623/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com