- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在为我的一门大学类(class)做毕业设计,我需要找个地方来运行我用 C# 编写的几个爬虫。没有网络托管经验,我有点迷茫。这是任何网站都允许的吗?我是否需要一个特殊的主机来提供对服务器的更多访问权限?爬虫是一个简单的应用程序,它完成自己的工作,然后定期将信息写入远程数据库。
最佳答案
网络爬虫是对普通用户的模拟。它像浏览器一样访问站点,获取从服务器返回的 html 代码(javascript 等)(因此无法内部访问服务器代码)。因此,任何网站都可以被抓取。
注意一些 web crawler ethics guidelines .有些页面你不应该索引或点击它的链接。网络开发人员会为网络爬虫构建一些文件和说明,说明您可以索引或关注的内容。
关于c# - 什么样的网络主机可以让你在上面运行爬虫?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1223541/
我认为这应该不是一个大问题,但我自己找不到解决方案。一如既往:p 我有一个 UIWebView,其背景颜色设置为clearColor,但是当我尝试向下滚动太多时,我会在加载的 HTML 上方看到深灰色
我注意到,每当我重新安装我的应用程序时,IdentifierForVendor 都会不断变化。有没有办法让我的设备拥有相同的标识符?问题是,我需要确保标识符相同,因为我有一个备份系统,即使在删除并重新
一切都在标题中。 我有一个带有单元格的 UITableView。 cells 有一个Shadow (self.layer.shadow...)。 问题是一个单元格的阴影重叠上方的单元格。我怎样才能防止
我正在尝试创建一个切换开关,您可以在其中点击一侧,然后背景会滑过以使该侧“处于事件状态”。 为了适应可变宽度,我使用 display: table 设置了切换的两侧。这很好用。然后,我将第三个 div
我是一名优秀的程序员,十分优秀!