gpt4 book ai didi

python - 如何用西里尔语解码类似 JSON 的字符串?

转载 作者:太空宇宙 更新时间:2023-11-03 18:52:03 25 4
gpt4 key购买 nike

我正在尝试在 Scrapy 中创建一个简单的蜘蛛,它将从网站获取所有广告。问题是所有广告都是西里尔文,所以我得到这样的字符串:

1-\u043a\u043e\u043c\u043d\u0430\u0442\u043d\u0430\u044f \u043a\u0432\u0430\u0440\u0442\u0438\u0440\u0430

这是蜘蛛的代码:

def parse_advert(self, response):
x = HtmlXPathSelector(response)

advert = AdvertItem()

advert['title'] = x.select("//h1/text()").extract()
advert['phone'] = "111111111111"
advert['text'] = "text text text text text text"
filename = response.url.split("/")[-2]
open(filename, 'wb').write(str(advert['title']))

有什么方法可以即时“翻译”该字符串吗?

谢谢。

最佳答案

使用str.decode('unicode-escape'):

>>> print r'1-\u043a\u043e\u043c\u043d\u0430\u0442\u043d\u0430\u044f \u043a\u0432\u0430\u0440\u0442\u0438\u0440\u0430'
1-\u043a\u043e\u043c\u043d\u0430\u0442\u043d\u0430\u044f \u043a\u0432\u0430\u0440\u0442\u0438\u0440\u0430
>>> print r'1-\u043a\u043e\u043c\u043d\u0430\u0442\u043d\u0430\u044f \u043a\u0432\u0430\u0440\u0442\u0438\u0440\u0430'.decode('unicode-escape')
1-комнатная квартира

关于python - 如何用西里尔语解码类似 JSON 的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18118594/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com