python - Scrapy Pyinstaller OSError : could not get source code/twisted. internet.defer._DefGen

python - Scrapy Pyinstaller OSError : could not get source code/twisted. internet.defer._DefGen_Return

转载作者：行者123 更新时间：2023-12-04 12:02:45

28

4

我正在尝试使用 pyinstaller 将一个非常简单的爬虫蜘蛛发布为 .exe。
我已经搜索并阅读了我能找到的所有内容，但我仍然无法弄清楚出了什么问题。任何正确方向的帮助或指示都非常有用!

如果我将 yield 更改为 return 它不会给我错误并且可以正常工作，除了它只返回 1 个项目(这是正常的，因为它是 return 而不是 yield。)代码工作得很好，我的 IDE 中没有任何错误(不使用 pyinstaller .exe)

笔记:
我正在使用 pyinstaller 开发版本。

运行我的 .exe 时出错

2020-04-28 11:57:30 [scrapy.core.scraper] ERROR: Spider error processing <GET http://books.toscrape.com/> (referer: None)
Traceback (most recent call last):
  File "lib\site-packages\twisted\internet\defer.py", line 1418, in _inlineCallbacks
  File "lib\site-packages\scrapy\core\downloader\middleware.py", line 42, in process_request
  File "lib\site-packages\twisted\internet\defer.py", line 1362, in returnValue
twisted.internet.defer._DefGen_Return: <200 http://books.toscrape.com/>

During handling of the above exception, another exception occurred:
Traceback (most recent call last):
  File "lib\site-packages\scrapy\utils\defer.py", line 55, in mustbe_deferred
  File "lib\site-packages\scrapy\core\spidermw.py", line 60, in process_spider_input
  File "lib\site-packages\scrapy\core\scraper.py", line 148, in call_spider
  File "lib\site-packages\scrapy\utils\misc.py", line 202, in warn_on_generator_with_return_value
  File "lib\site-packages\scrapy\utils\misc.py", line 187, in is_generator_with_return_value
  File "inspect.py", line 973, in getsource
  File "inspect.py", line 955, in getsourcelines
  File "inspect.py", line 786, in findsource
OSError: could not get source code

myBookSpider.py:

import scrapy
from items import scrapyStandaloneTestItem

class bookSpider(scrapy.Spider):

    name = "bookSpider"
    custom_settings = {
        "FEED_URI" : "resultFile.csv",
        "FEED_FORMAT" : "csv",
        "FEED_EXPORT_FIELDS" : ["title", "price"]
    }

    def start_requests(self):

        urls = [
            "http://books.toscrape.com/",
        ]

        for url in urls:

            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):

        # Getting an instance of our item class
        item = scrapyStandaloneTestItem()

        # Getting all the article's with product pod class
        articles = response.css("article.product_pod")

        # Looping thru all the article elements we got earlier
        for article in articles:

            # Getting the needed values from the site and putting them in variables
            title = article.css("a::attr(title)").extract()
            price = article.css("p.price_color::text").extract()

            # Setting the title / price variables in our items class equal to the variables that we just extracted data in to
            item["title"] = title
            item["price"] = price
            yield item

项目.py:

import scrapy

class scrapyStandaloneTestItem(scrapy.Item):

    # define the fields for your item here
    title = scrapy.Field()
    price = scrapy.Field()

运行Spider.py:

# In this file we will run the spider(s)
from scrapy.crawler import CrawlerProcess
from myBookSpider import bookSpider
from scrapy.utils.project import get_project_settings

def runSpider():

    # Running scraper
    process = CrawlerProcess(get_project_settings())
    process.crawl(bookSpider)
    process.start()

if (__name__ == "__main__"):

    runSpider()

最佳答案

迟到的答案，但我会为其他人保留它，您所要做的就是将此代码添加到您的蜘蛛中，`
导入scrapy.utils.misc
导入scrapy.core.scraper

def warn_on_generator_with_return_value_stub(spider, callable):
    pass

scrapy.utils.misc.warn_on_generator_with_return_value = warn_on_generator_with_return_value_stub
scrapy.core.scraper.warn_on_generator_with_return_value = warn_on_generator_with_return_value_stub`

关于python - Scrapy Pyinstaller OSError : could not get source code/twisted. internet.defer._DefGen_Return，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61478001/

28

4

0

文章推荐： python - 加速python pygame中的AI障碍检测

文章推荐： java - 无法构建插件flutter_plugin_android_lifecycle

文章推荐： postgresql - 启动 postgres 容器时出错 - mkdir : Permission denied

internet-explorer - 在同一台计算机上运行 Internet Explorer 6、Internet Explorer 7 和 Internet Explorer 8
像其他人一样，我需要在 Internet Explorer 6 和 Internet Explorer 7 上测试我的代码。现在，Internet Explorer 8 为开发人员提供了一些很棒的工具
internet-explorer - 如何使用注册表修改 Internet Explorer 临时 Internet 设置？
我已经浏览了几个小时的注册表，但似乎无法找到控制 Internet Explorer 临时 Internet 文件设置的注册表。我想从自动更改为其他内容。最佳答案 HKCU\Software\Mic
internet-explorer - Internet Explorer 8 和 Internet Explorer 6 并排
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Running Internet Explorer 6, Internet Explorer 7, and Int
internet-explorer - 如何从 Internet Explorer 11 降级到 Internet Explorer 10？
作为一名开发者，我发现新的 Internet Explorer 版本完全是一场噩梦。我关闭了 Windows 功能，但无法安装 Internet Explorer 10 。它说它已经安装，但事实并非如
internet-explorer - Internet Explorer探查器
是否有任何分析器工具可以调试DOM中的哪个javascript /对象导致Internet Explorer挂起/崩溃。 CPU使用率将超过60％，我想知道其背后的原因，是哪个脚本/ Flash Ob
internet-explorer - Internet Explorer中TTF支持的状态是什么？
我正在尝试确定Internet Explorer上TTF字体格式的支持状态。 (我手头没有任何Windows计算机可以尝试。)The table at caniuse指出，从版本9开始的IE支持TTF
internet-explorer - Internet Explorer多个jdk版本
是否可以在 Internet Explorer 中切换多个版本的 JDK/JRE？想要使用 jdk 1.4、jdk 5 和 jdk 6。谢谢，迈克尔最佳答案据我所知，这并不容易做到，因为 IE
internet-explorer-8 - IE8 :Internet Explorer was not able to open this Internet site. 请求的站点不可用或找不到
这应该是IE8下载问题的老问题了。我使用 PHP 来设置响应头，如: header("Pragma: public"); header("Expires: 0"); header("Content-t
internet-explorer-6 - Internet Explorer 6 和 Internet Explorer 7 在同一台计算机上进行调试
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Running Internet Explorer 6, Internet Explorer 7, and Int
internet-explorer - 为什么即使在模拟 Internet Explorer 8 文档模式时，Internet Explorer 11 也不支持条件注释？
我正在使用新的Internet Explorer 11开发人员工具将文档模式切换为“8”，但条件注释仍然被忽略，也就是说，它们没有被正确解析并且表现得像普通注释。因此，浏览器不会请求/加载条件注释内的
internet-explorer-7 - 是否可以出于调试目的从 Internet Explorer 7 降级到 Internet Explorer 6？
我在我的一个站点上遇到 Internet Explorer 6 问题，我真的希望我安装它而不是 Internet Explorer 7。有没有一种快速的方法来做到这一点？最佳答案下载Microso
javascript - 对于 Internet Explorer 我应该使用什么来使 Internet Explorer 禁用 Internet Explorer 的默认下拉样式
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and t
internet-explorer - 如何从 Powershell 访问 Internet Explorer 运行实例的经典 Internet Explorer COM 自动化对象？
如何访问 Internet Explorer 运行实例的经典 Internet Explorer COM 自动化对象？也就是说，如果我在多个窗口中打开 Internet Explorer，如何从 Po
internet-explorer - Internet Explorer 中带有空格的内容处理附件文件名
string filename = Server.UrlPathEncode(Path.GetFileName(_Filename))); Response.AddHeader("Content-Di
internet-explorer - Internet Explorer 永远等待本地主机
当我尝试使用 Apache 2.2 在 Windows7(64 位)上的 IE9 或 IE10 中打开 localhost 时，解析 URL 需要很长时间。其他浏览器没有问题并立即解析 URL，只有
internet-explorer - 如何从批处理文件打开和关闭 Internet Explorer？
我有一个批处理文件，必须启动 Internet Explorer 并打开 www.google.com .当整个页面加载完成时，它应该终止 IE 进程，即关闭该系统中的所有 IE 实例。我的批处理文件
internet-explorer - Internet Explorer 的测试自动化
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 6 个月前关闭。 Improve t
internet-explorer - Internet Explorer - 浏览时的奇怪形状
基本上，无论我使用 IE 访问哪个网站，我都可以看到那些黑色/白色形状，一旦我将鼠标移到它们上，它们就会消失。想知道是否有人知道可能导致这种情况的原因？另外:http://imageshack.c
internet-explorer - Internet Explorer 在哪里存储它的附加组件？
我检查了所有注册表，但找不到所有已安装扩展的列表。此时，IE 扩展/加载项的任何一般位置都会有所帮助。最佳答案取自 here : 浏览器帮助对象 - 旨在增强浏览器功能的浏览器插件。条目可以在
internet-explorer - Internet Explorer 平滑滚动检测
这是一个两部分的问题。我正在构建一个网页，我需要知道: 有没有办法检测 IE 是否启用了平滑滚动(如果是，如何)？有没有办法强制 IE 关闭我网页的平滑滚动功能？明确地说，我不是在问如何关闭整个计

首页

博学

6Ren·AI

商城

python - Scrapy Pyinstaller OSError : could not get source code/twisted. internet.defer._DefGen_Return