- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在编写 HTML 屏幕抓取工具。为此创建单元测试的最佳方法是什么?
拥有一个静态 html 文件并在每次测试时从磁盘读取它“可以”吗?
你有什么建议吗?
最佳答案
为了保证测试可以反复运行,您应该有一个静态页面来测试。 (即从磁盘上可以)
如果您编写的测试涉及网络上的实时页面,那可能不是单元测试,而是集成测试。你也可以拥有这些。
关于c# - 单元测试屏幕刮刀,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1256091/
我正在使用lxml.html模块 from lxml import html page = html.parse('http://directory.ccnecommunity.org/repor
我正在使用以下 python 脚本从亚马逊抓取信息 pages . 在某些时候,它停止返回页面结果。脚本正在启动,浏览关键字/页面,但我只得到标题作为输出: Keyword Rank Title AS
因此,我尝试使用 jsoup 来抓取 Reddit 中的图像,但是当我抓取某些子 Reddits(例如/r/wallpaper)时,我收到 429 错误,并且想知道如何解决此问题。完全理解这段代码很糟
我正在尝试在 Apache Nutch 中构建爬虫和抓取工具,以查找包含讨论特定单词主题(例如“选举”、“选举”、“投票”等)部分的所有页面。 一旦我进行了抓取,Nutch 就会清除 HTML 中的停
概念: 使用带有 Python 和 Selenium 的 AWS Lambda 函数,我想通过传递 headless chrome test 创建一个无法检测到的 headless chrome 刮板
我是一名优秀的程序员,十分优秀!