gpt4 book ai didi

python - 如何使用 python 修复包含字符\u2014、\u2017 等的文本文件?

转载 作者:行者123 更新时间:2023-12-01 02:30:36 24 4
gpt4 key购买 nike

文本文件的内容类似于

"Length: As per client\u2019s need|\u2022 Material: CFC|\u2022"

我正在尝试将其转换为字符。如何读取,将其转换为字符并保存回来。

screenshot

最佳答案

一般来说,类似于

uni_chr_re = re.compile(r'\\u([a-fA-F0-9]{4})')

lines = []
with open(filename) as f:
for line in f:
lines.append(uni_chr_re.sub(lambda m: unichr(int(m.group(1), 16)), line))

这是一般方法,但具体细节取决于细节,例如本文的来源,如 Martijn pointed out .

关于python - 如何使用 python 修复包含字符\u2014、\u2017 等的文本文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46863280/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com