gpt4 book ai didi

c# - 如何在 C# 中从维基百科的页面中提取维基代码而不是 html?

转载 作者:太空宇宙 更新时间:2023-11-03 12:08:55 27 4
gpt4 key购买 nike

当您在某个维基百科页面上单击“编辑”时,是否知道如何下载显示在维基百科页面上的维基代码?示例:

//EXAMPLE:

using System.Net;

public void download() {
string page = "https://en.wikipedia.org/w/index.php?title=Albatross&action=edit";

using (WebClient client = new WebClient())
{
string htmlCode = client.DownloadString(page);
// how to get the wiki code in the html edit box here?
}

最佳答案

没有 HAP 的更新根据 wimh 的评论。只需将 &action=raw 作为查询字符串附加即可让您无需抓取即可完成这项工作。

using System;
using System.Net.Http;

public class Program
{
private static HttpClient client = new HttpClient();

public static void Main()
{
var response = client.GetAsync("https://en.wikipedia.org/w/index.php?title=Albatross&action=edit&action=raw").Result;
var rawEditCode = response.Content.ReadAsStringAsync().Result;

Console.WriteLine(rawEditCode);
}
}

fiddle :https://dotnetfiddle.net/NwZC3I

原始答案你可以使用 HtmlAgilitypack并简单地刮掉它:

using System;
using HtmlAgilityPack;

public class Program
{
public static void Main()
{
HtmlWeb web = new HtmlWeb();
HtmlDocument html = web.Load("https://en.wikipedia.org/w/index.php?title=Albatross&action=edit");

var editorContent = html.DocumentNode.SelectSingleNode(@"//textarea[@id='wpTextbox1']").InnerHtml;
Console.WriteLine(editorContent);
}
}

dotNetFiddle:https://dotnetfiddle.net/fmsT1m

关于c# - 如何在 C# 中从维基百科的页面中提取维基代码而不是 html?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53400447/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com