python - 避免 Python 3 中的堆栈溢出-6ren

python - 避免 Python 3 中的堆栈溢出

转载作者：太空宇宙更新时间：2023-11-04 05:46:21

26

4

免责声明:我完全不了解计算机科学，也不了解幕后发生的任何事情的内部运作方式。使用 Internet 上的所有内容自学编码。

Python 版本:

Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit(Intel)] on win32

在普通解析器上工作，其主要目的是获取图像的完整大小的 url，将其保存到文件中以供稍后下载，然后移动到下一个图像，这几乎是强制性的，因为相关网站的糟糕网络架构。当我完成程序时，在第 976 次执行时遇到错误。

  RuntimeError: maximum recursion depth exceeded in comparison

经过研究，我发现问题是由于“堆栈溢出”引起的。但是，目前我不知道如何在不造成任何显着性能下降的情况下解决问题。 (虽然这不是真正的问题，因为我只是为了学习而这样做。)

这让我想到了我的问题，我该如何解决这个问题，我在哪里可以了解更多关于这些事情的信息，比如什么是 Stack Overflow？

(程序运行正常，堆栈溢出停止了)

import requests
from bs4 import BeautifulSoup

def somesite_parsing(url):

    connection = requests.get(url)
    html = connection.text
    soup = BeautifulSoup(html, "html.parser")

    # The exception is necessary due to the web architecture.
    # Images that don't have different versions by size have an img tag.
    # Returns "http://www.somesite.net/tag_tag_tag.full.jpg"
    try:
        semi_link = soup.select("html > body > #wrapper > #body > #content > #large > a")
        full_link = semi_link[0].get("href")
        print(full_link)

    except IndexError:
        semi_link = soup.select("html > body > #wrapper > #body > #content > #large > img")
        full_link = semi_link[0].get("src")
        print(full_link)

    # File was created during testing so I switched to appending.
    # Saves link into folder.
    fx = open("list_file.txt", "a")
    fx.write(full_link + "\n")
    fx.close()

    # Fetches the next url.
    # Returns "/id_number"
    next_link = soup.select("html > body > #wrapper > #body > #menu > .smallthumbs > li > a")
    next_link = next_link[0].get("href")
    next_link = "http://www.somesite.net" + next_link
    print(next_link)

    print()
    somesite_parsing(next_link)


somesite_parsing("http://www.somesite.net/1905220")

最佳答案

当嵌套的函数调用过多时会发生堆栈溢出。这主要发生在函数继续无休止地调用自身时。

在您的情况下，您在自身内部调用了 somesite_parsing。这最终会导致堆栈溢出。

有几种方法可以避免这种情况。我建议围绕您的解析进行循环。

改变 somesite_parsing 返回下一个链接，而不是调用它自己，你可以这样做:

next_link = "http://www.somesite.net/1905220"
while next_link:
    next_link = somesite_parsing(next_link)

这将允许您返回 falsy来自 somesite_parsing 的值以停止循环。

关于python - 避免 Python 3 中的堆栈溢出，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32124121/

26

4

0

文章推荐： c - 如何处理结构数组？

文章推荐： php - 有人熟悉PHP源代码吗？

文章推荐： node.js - 如何从文件路径获取应用程序名称/元数据

Web 堆栈 - 常见 Web 堆栈/环境的列表
出于好奇 - 我知道有 LAMP - Linux、Apache、MySQL 和 PHP。但是还有哪些其他 Web 堆栈替代方案的缩写呢？像 LAMR - Linux、Apache、MySQL Ruby
JavaScript 堆栈，LIFO 堆栈 : value not as expected
我有以下代码。 var stackMapIn = []; var stackMapOut = []; var stackBack = []; stackMapOut.push("m1"); $scop
amazon-web-services - 已删除 Cloudformation 堆栈，由于资源已存在，现在无法重新创建新的 Cloudformation 堆栈
我遇到了导致我的堆栈无法恢复的情况，我别无选择，只能将其删除。使用完全相同的模板，我继续创建了另一个同名的堆栈。 The following resource(s) failed to create:
ruby-on-rails - 与 Rails(堆栈)目录相比，MEAN(堆栈)Node.js 应用程序目录是什么样的？
这是我第一次查看 Node 堆栈，自从我学习使用 Ruby on Rails 进行 Web 开发以来，我对一些基本的东西有点困惑。我了解 Rails 目录是什么样的。 demo/ ..../app .
C语言使用深度优先搜索算法解决迷宫问题(堆栈)
本文实例讲述了C语言使用深度优先搜索算法解决迷宫问题。分享给大家供大家参考，具体如下：深度优先搜索伪代码（Pseudocode）如下： ?
项目特定位置的 Haskell 堆栈
我正在按照指南 here ，它告诉我: The stack setup will download the compiler if necessary in an isolatedlocation (
Haskell 堆栈，如何在全局范围内恢复在多个包中发现的模棱两可的模块名称
同时 trying to debug a different question ，我安装了一个似乎与我安装的其他一些软件包冲突的软件包。我跑了 $ stack install regex-pcre-
java - 我的java方法代码有什么问题？ - 堆栈
我花了几个小时创建了一个方法，该方法将从堆栈 s1 中获取 null 元素，并将它们放入 s2 中。然后该类应该打印堆栈。方法如下 import net.datastructures.ArraySta
java 堆栈 NullPointerException
我有一个类Floor，它有一个Stack block ，但我不知道如何初始化它。我曾尝试过这样的: public class Floor { private Stack stack;
具有元素限制的 Java 堆栈
我知道这个问题已经问过很多次了，但搜索一个小时后我仍然遇到问题。我想使用一个 lifo 堆栈，它可以存储最大数量的元素。达到最大数量后，首先删除该元素并将其替换为新元素，这样在第一次弹出时我可以获取
java - 谁能告诉我我做错了什么？ - 堆栈
我需要编写一个方法，压缩以执行以下操作；目标compress方法是从栈s1中移除所有null元素。剩余(非空)元素应按其初始顺序保留在 s1 上。辅助堆栈 s2 应用作s1 中元素的临时存储。在该方
JavaScript 堆栈、队列和事件循环？
我正在尝试验证以下代码发生的顺序。 function square(n) { return n * n; } setTimeout(function(){ console.log("H
c - 动态字符数组 - 堆栈
我需要一个字符数组，其中包含基于特定文件夹中文件数量的动态数量的字符数组。我能够通过初始化 char (*FullPathNames)[MAX_FILENAME_AND_PATHNAME_LENGTH
c++ - 堆栈/帧指针作为外部变量
我正在编写一些日志逻辑并想要进行一些缩进。了解是否存在任何函数调用或某个函数是否已完成的最简单方法是查看堆栈/帧的当前地址。让我们假设堆栈颠倒增长。然后，如果 log() 调用中的堆栈地址小于前一次调
c - 堆栈、数据和指令段在哪里实现？
所以内存分段在x86-64中被放弃了，但是当我们使用汇编时，我们可以在代码中指定.code和.data段/段，并且还有堆栈指针寄存器。还有堆栈段、数据段和代码段寄存器。代码/数据/堆栈的划分是如何
c# - 堆栈 - 值类型的值存储在哪里？
void main() { int x = 5; // stack-allocated Console.WriteLine(x); } 我知道 x 是堆栈分配的。但是关于 x 的堆栈中
Java 程序输出(堆栈)
这是我关于 SO 的第一个问题。这可能是一个愚蠢的问题，但到目前为止我还没弄明白。考虑下面的程序 Reader.java: public class Reader { public
Java 堆栈/嵌套计数
java中有没有一种快速的方法来获取嵌套/递归级别？我正在编写一个函数来创建组及其成员的列表。成员也可以是团体。我们最终可能会得到一组循环的组/成员。我想在某个任意级别停止。我知道我可以将变量保
c++ - 堆栈/堆分配数组的销毁顺序
考虑以下代码: struct A{...}; A a[100]; A* pa = new A[100]; delete[] pa; a/pa 元素的销毁顺序是由标准定义的还是实现定义的(对于第二种情况
具有多个值的 C++ 堆栈
我在下面有一些代码。此代码是一个基本的压入/弹出堆栈类，我将其创建为模板以允许某人压入/弹出堆栈。我有一个家庭作业，我现在要做的是创建一个具有多个值的堆栈。所以我希望能够创建一个基本上可以发送三个整

首页

博学

6Ren·AI

商城

python - 避免 Python 3 中的堆栈溢出