gpt4 book ai didi

python - 将文件中的特殊字符替换为其 unicode 代码 (Python)

转载 作者:行者123 更新时间:2023-12-01 04:34:23 25 4
gpt4 key购买 nike

我有一个有趣的问题。假设有一个字符列表及其在 unicode 中的匹配表示形式:

list_of_special_chars = [
('Ą', b'\u0104'),
('ą', b'\u0105'),
('Ę', b'\u0118'),
('ę', b'\u0119'),
('Ó', b'\xd3'),
('ó', b'\xf3'),
('Ć', b'\u0106'),
('ć', b'\u0107'),
('Ł', b'\u0141'),
('ł', b'\u0142'),
('Ń', b'\u0143'),
('ń', b'\u0144'),
('Ś', b'\u015a'),
('ś', b'\u015b'),
('Ź', b'\u0179'),
('ź', b'\u017a'),
('Ż', b'\u017b'),
('ż', b'\u017c')
]

现在,考虑创建一个包含以下短语的文本文件:Cześć, jak się masz?

如何将文本替换到文件中以创建如下所示的新文件:Cze\u015b\u0107, jak si\u0119 masz?

我尝试了不同的方法,但无法解决 python 处理字符串的方式的此类问题。例如,"Czesć".replace("ć", "\u0107") 始终是同一个单词。

最佳答案

您需要对反斜杠进行转义,以便 \u 不会被视为 Python 转义序列的开头。

"Czesć".replace("ć", "\\u0107")

关于python - 将文件中的特殊字符替换为其 unicode 代码 (Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31991789/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com