gpt4 book ai didi

c# - 从 C# 中的 HTML 响应中解析 javascript 值

转载 作者:行者123 更新时间:2023-11-28 08:53:33 25 4
gpt4 key购买 nike

我实际上正在构建一个应用程序,通过使用 .NET 4.5 中的 HttpClient,我向网页(不是我的)发送 GET 请求,并在内容中收到此响应:

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:widget="http://www.netvibes.com/ns/">
<head>
<meta http-equiv="content-type"
content="text/html;charset=utf-8" />
<script type="text/javascript">var NREUMQ=NREUMQ||[];NREUMQ.push(["mark","firstbyte",new Date().getTime()]);</script><title>Site</title>

<script type="text/javascript">
var HOST_DOMAIN = 'http://www.site.com/';
var ID = '2261443944';
var BASE_URL = 'https://base.site.com';
</script>

</head>
<body >
</body>
</html>

我想做的是使用 .NET 4.5 库从 head 部分的 js 脚本中解析值 HOST_DOMAIN、ID 和 BASE_URL,但我找不到方法。有什么想法吗?

最佳答案

使用正则表达式来捕获组中的 url。

  string pattern = @"var HOST_DOMAIN = '([^']+)';";
Match match = Regex.Matches(html, pattern)).FirstOrDefault();
if (match != null)
return match.Groups[1].Value;

说明:括号在正则表达式中定义一个组,该组存储在匹配的 Groups 属性中。

可能的问题:如果网址包含转义的撇号,则不起作用。

关于c# - 从 C# 中的 HTML 响应中解析 javascript 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18800856/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com