- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我进行了搜索,但找不到任何对我有用的东西。
不久前,我开始使用 C#,我的第一个个人项目是一个简单的 WebCrawler。它应该检查源代码中的特殊字符串,以确定是否包含 Google Analytics 或类似的内容。
所以它工作正常,但当然我缺少 JS 和 Iframe,因为 HttpWebRequest 不会呈现我所知道的网站。
所以我想检查"<script src=""
例如然后通过分割得到URL。但这并没有按预期工作,我认为这不是一个干净且好的方法。
由于我正在检查字符串,因此只需将 "<script"
中的字符串更改即可将其破坏。至"< script"
作为示例,所以我不知道如何从大字符串中获取特定字符串。
我找到了正则表达式(rex)和 split,但我不确定 rex 和 split 是否好,因为可能有更多类型的 "src="
或split("\"", "\"", text)
我不想“给你”,当然我想理解并自己做,但我不知道从这里该去哪里..
抱歉,文字很长,没有示例,但目前我无法访问,除了 rex 和 split 之外,没有太多内容
编辑:我想我会创建一个类来检查每个字符是否有特殊行,例如“
最好,迈克
最佳答案
我个人没有使用过它,但类似的东西应该可以工作(我没有测试过):
string url = "some/url";
var request = (HttpWebRequest)HttpWebRequest.Create(url);
var webResponse = (HttpWebResponse)request.GetResponse();
var responseStream = webResponse.GetResponseStream();
var streamReader = new StreamReader(responseStream);
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(streamReader.ReadToEnd());
var scripts = doc.DocumentNode.Descendants()
.Where(n => n.Name == "script");
这应该让你所有的脚本节点都可以用它们来做你想要的事情 =)
关于C# 从 HttpWebRequest/WebResponse 中过滤 JS 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24370113/
我正在尝试使用 C# 和 WebRequest 从 Internet 获取一个大文件。到目前为止,我拥有的所有其他东西都工作正常,但似乎我得到的响应中间的某些部分被删除了。我尝试打印出 respons
我正在尝试编写一个简单的程序来从网站返回状态代码。当前使用 HttpWebRequest 和 HttpWebResponse 类。然而,它们的工作方式对我来说似乎很糟糕,只有在 200/OK 时才会返
我目前正在研究一个帮助我创建带有 cookie 和 POST 参数的 WebRequest 的类。但是 response.cookies 总是空的。我如何获取返回的 cookie 并将它们与下一个请求
所以我正在制作一个程序,它几乎可以生成批量 HttpWebRequests。在这个程序中,速度是主要的。如果我能找到将 HttpWebRequests 增加一毫秒的方法,那就太好了。 好吧,我的问题是
网站上有一个 PHP 脚本。我还有一个 C# winforms 程序,它使用 WebRequest/WebResponse 方法发送 POST 消息。 此 PHP 脚本连接到 mysql 数据库,获取
使用 C#,我需要确定开始从 WebRequest 接收响应所需的时间(目前,我不担心下载完整响应所需的时间)。 据我所知,为此我需要使用 WebRequest 的异步方法。这是我想出的: publi
我们正在将我们的解决方案之一移植到 PCL,但在 NET 框架基类库的受支持类和属性方面面临很多问题。为了使相同的功能在不同的平台上工作,我们实现了 WebClient,但我们在 WebResporn
我正在尝试使用 Web 服务将数组返回到我的 GUI,但我不知道如何从 WebResponse 中实际提取数组。 这是 GUI 中调用 Web 服务的方法: public static ArrayLi
我正在使用 C# 开发 Windows 应用商店应用程序,我是这个平台的新手(我主要从事 IOS 和 Android 方面的工作)。 我有一个简单的异步方法可以从远程服务器下载原始数据。它工作正常,除
我一直在 F# 交互式 session 中尝试一些基本的 HTTP 请求响应操作,以尝试更好地感受这门语言。这里的一切似乎都按预期工作,除了当我获得 HTTP 请求的响应流时,我似乎永远无法从中读取任
WebResponse response; try { HttpWebRequest request = (HttpWebRequest)WebRequest.Crea
我知道这是一个菜鸟问题,但只是想知道 GetResponseStream() 是否可以在任何情况下返回 null? 最佳答案 好吧,这有点取决于具体的子类 - 但我从未见过任何这样做的子类,而且它没有
我有一个 .Net Framework #4.0 应用程序,它使用 WebRequest/WebResponse 类发出大量 Web 请求,因为我发现它有内存泄漏(或者我做错了什么)我写了一些简单的小
通常,人们会编写类似这样的代码来使用 WebRequest 下载一些数据。 using(WebResponse resp = request.GetResponse()) // WebRequest
private void RespCallback(IAsyncResult asynchronousResult) { try { WebRequest myWebR
我在 C# 中有一个函数,它通过从路由器页面检索 64b XML 来获取 Internet 的状态 public bool isOn() { HttpWebRe
从 WebResponse 获取文件(在本例中为 .PDF,但任何文件都可以)并将其放入 MemoryStream 的最佳方法是什么?使用 WebResponse 中的 .GetResponseStr
调用初始 HttpWebResponse.GetResponseStream() 并读取流后,该流已完成且无法重用。 我遇到一种情况,我需要检查响应的内容,如果它是特定数据,则获取另一个页面,然后将新
我使用 MVC4 Web API 创建了一个 RESTful 网络服务。如果出现问题,我将抛出 WebException。 throw new WebException("Account not fo
我正在尝试编写一个单元测试,其中我的 sut (authMock) 的依赖项应该抛出一个具有特定响应的 Webexception(将在 sut 中相应地解析的 json)。但是,我无法像这样使用 Mo
我是一名优秀的程序员,十分优秀!