- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以,我现在正在用 Python 开发一个简单的网络爬虫,但我有一个关于如何构建我的代码的问题。在其他编程语言(尤其是 C++ 和 C# 等编译语言)中,我习惯将所有函数包装在类中。 IE。在我的网络抓取示例中,我可能有一个名为“WebScraper”之类的类,然后保存该类中的所有函数。如果我需要实例化原始“WebScraper”类的多个实例,我什至可能会创建第二个帮助器类,例如“WebScraperManager”。
不过,这引出了我当前的问题。类似的逻辑在当前示例中是否成立?或者我会简单地定义一个 WebScraper.py 文件,而该文件中没有包装器类,然后只需将我需要的函数导入到某个 main.py 文件中?
最佳答案
类和函数之间的区别应该在于类具有状态。有些类没有状态,但这很少是一个好主意(我确信有异常(exception),例如抽象基类(ABC),但我不确定它们是否计数),并且有些函数确实有状态,但是这很少是一个好主意(缓存或检测可能是异常(exception))。
如果你想要一个 URL 作为输入,并说一个 dict 作为输出,然后你就完成了该网站,那么就没有理由有一个类。只需有一个接受 URL 并返回字典的函数即可。无状态函数是比类更简单的抽象,因此在所有其他条件相同的情况下,更喜欢它们。
但是,很多时候可能会涉及中间状态。例如,也许您正在抓取基于基本 URL 的一系列页面,而急于完成所有这些操作的成本太高。也许您想要的是一个以根 URL 作为其构造函数的类。然后,它有一些方法用于查询它可以跟踪哪些子 URL,以及用于排序后续子项抓取的方法,这些子项可能存储在嵌套数据结构中。
当然,如果您的任务相当复杂,您很可能拥有使用类或调用函数的类的函数的层。但持久状态可以很好地指示当前任务是否应该编写为类或函数集。
编辑:只是为了关闭循环并回到原来的问题:不,我想说将所有函数包装在类中不是Python式的。自由函数在 python 中很好,这完全取决于什么是合适的。另外,Pythonesque 这个术语并不是很 Pythonic ;-)
关于python - 是不是 "Python-esque"将所有函数包装在一个类中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39984082/
此处,“OK”当然意味着 AYOR(风险由您自己承担),但如果避免与现有属性名称发生明显冲突,则不会出现可预见的问题。 Skyfield物体——尤其是行星——通常具有有限数量的属性。我经常编写简短的脚
我们有一个(假设)将在 1-2 年内完成的项目。到那时,JDK7(希望还有 Java7 JCP 规范)应该准备就绪。 但是,我想知道,甲骨文做出“愚蠢”决定的“危险”有多大,这会使 JDK7 成为一个
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 6 年前。 Improv
要知道,haswell是英特尔作为Ivy Bridge微架构的“第四代核心”继承者而开发的一种处理器微架构的代号。 1英特尔正式发布了基于这种微架构的CPU... More 但是,我想知道如何通过在
修改 setter 参数是否正常?假设我们有 setString 方法。我们真的想保留字符串的修剪形式。所以带有尾随空格的字符串是无效的,但我们不想抛出异常。 最好的解决办法是什么?修剪 setter
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 去年关闭。 Improve this
我写了一段代码,然后编译它没有错误。但是当我运行时,它会引发异常(java.lang.NoClassDefFoundError: TesKt$test$1$1)。 这是语言错误吗? private f
这道题是从算法导论的习题23.1-7演化而来的。 原问题是: 23.1-7争论如果一个图的所有边权重都是正的,那么连接所有顶点并且具有最小总权重的边的任何子集必须是一棵树。举例说明,如果我们允许某些权
假设我创建了一个 lambda 实例,稍后我想查询该对象以查看它是 proc 还是 lambda。如何做到这一点? .class() 方法不起作用。 irb(main):001:0> k = lamb
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
所以我正在将我的一个程序移植到一个新的游戏机上。问题是用于编译我的 c++ 应用程序的 SDK 不支持 __int16,但它支持 int16_t。使用 int16_t 代替 __int16 是否“安全
我最近偷看了 Url.IsLocalUrl() 方法的实现,该方法被广泛使用并被推荐为用于防止重定向攻击的措施之一。我惊讶地发现,如果我要为我的应用程序中的 Controller 的其中一个操作提供完
我读了这篇好文章 Angular onPush Change Detection Strategy 在某个时候他写道: It’s an anti-pattern to expose your subj
我是这样理解的: Innodb 中的缓冲池:它存储来自 Sql 表的索引和数据并缓存它以供将来查询,因此它不需要一直打扰 Mysql。 Memcached:用于存储从 Innodb 接收到的数据并对其
以防万一 vector 为空,(意外,异常(exception)情况) cppreference 在 vector::back() 上说: Calling back on an empty conta
我是一名优秀的程序员,十分优秀!