gpt4 book ai didi

python - 用 U+FFFD 替换给定字符集之外的字符?

转载 作者:太空宇宙 更新时间:2023-11-03 18:30:33 25 4
gpt4 key购买 nike

我必须接受 utf-8 格式的用户输入并将其提供给仅接受 ISO-8859-15 的系统。 我想将用户提供的 unicode 字符串中的所有非 ISO-8859-15 字符转换为 U+FFFD,以便我可以向用户显示有问题的字符。实现这一目标最简单*的方法是什么?

我使用的是 Python 2.7。

*) 任意定义“最简单”:)

最佳答案

这个怎么样?

def is_latin_9(c):
try:
c.encode('iso-8859-15')
return True
except UnicodeEncodeError:
return False

def replace_non_latin_9(s):
return ''.join(c if is_latin_9(c) else u'\ufffd' for c in s)

关于python - 用 U+FFFD 替换给定字符集之外的字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22449384/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com