gpt4 book ai didi

python - 从python字符串中删除奇怪的字符

转载 作者:行者123 更新时间:2023-12-01 03:17:11 25 4
gpt4 key购买 nike

我必须解析一些从网络获取的网络数据。网页内容很可能是我正在处理的不同区域语言,没有任何问题。但是某些字符串中出现了一些无效字符,例如

I am wokring 8qîÚ4½-ôMºÝCQ´Dɬ)Q+R±}Ûýï7üÛ²ëlY&53|8ïôóg/^ÿûêþ?ï¯a #ï?¼ºy{5­+B^ß¿ß~¾¿½¦ÓûÆk.c¹~WÚ@ë¤KÈh4rF-G¦!¹ÿ¬¦a~µuÓñµ_»|þì daily statstistics

我必须删除这种奇怪的字符并仅提取有效的字符串。我正在使用Python。我用 utf-8 对每个字符串进行编码。

最佳答案

如果你的意思是奇怪的非ascii,你可以尝试:

import string
"".join(filter(lambda char: char in string.printable, s))

其中 s 是您的字符串。以下是您可以过滤的一些字符串常量: https://docs.python.org/3/library/string.html

关于python - 从python字符串中删除奇怪的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42363516/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com