gpt4 book ai didi

python - Scrapy yield utf-8

转载 作者:行者123 更新时间:2023-11-28 18:36:04 25 4
gpt4 key购买 nike

我正在尝试重写官方的 Scrapy 教程 ( http://doc.scrapy.org/en/latest/intro/tutorial.html )俄罗斯网站 habrahabr.ru 的代码。

这是我的代码:

import scrapy


class DmozSpider(scrapy.Spider):
name = 'habr'

allowed_domains = ['habrahabr.ru']

start_urls = [
'http://habrahabr.ru/interesting/'
]

def parse(self, response):
yield {'title': response.xpath('//title/text()').extract()[0]}

它返回:{'title': u'\u0418\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u0435\u043f\u0443\u0431\u043b\u0438\u043a\u0430\u0446\u0438\u0438/\u0425\u0430\u0431\u0440\u0430\u0445\u0430\u0431\u0440'}

当我尝试时:

 yield {'title': response.xpath('//title/text()').extract()[0].encode('utf-8')}

返回:

{'title': '\xd0\x98\xd0\xbd\xd1\x82\xd0\xb5\xd1\x80\xd0\xb5\xd1\x81\xd0\xbd\xd1\x8b\xd0\xb5 \xd0\xbf\xd1\x83\xd0\xb1\xd0\xbb\xd0\xb8\xd0\xba\xd0\xb0\xd1\x86\xd0\xb8\xd0\xb8 / \xd0\xa5\xd0\xb0\xd0\xb1\xd1\x80\xd0\xb0\xd1\x85\xd0\xb0\xd0\xb1\xd1\x80'}

我怎样才能改变这种行为?

最佳答案

转到setting.py 文件并设置FEED_EXPORT_ENCODING utf-8 的选项。

FEED_EXPORT_ENCODING = "utf-8"

这将解决您的问题。

关于python - Scrapy yield utf-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32413311/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com