gpt4 book ai didi

c++ - 将 HTML 源代码读取为字符串

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:08:36 26 4
gpt4 key购买 nike

我希望你不要对我皱眉头,但这应该可以很容易地由某人回答。我想将网站上的文件读入字符串,以便从中提取信息。

我只想要一种将 HTML 源代码读入字符串的简单方法。环顾四周数小时后,我看到了所有这些库和 curl 之类的东西。我只需要原始 HTML 数据。我什至不需要一个明确的答案。只是一些可以帮助我优化搜索的东西。

需要说明的是,我想要一个字符串中的原始代码,我可以操作它,不需要任何解析等。

最佳答案

您需要一个 HTTP 客户端库,其中之一是 libcurl。然后,您将向一个 URL 发出一个 GET 请求,并读回您选择的库提供的响应。

这是一个 example为了让您入门,它是 C,所以我相信您可以解决。

#include <stdio.h>
#include <curl/curl.h>

int main(void)
{
CURL *curl;
CURLcode res;

curl = curl_easy_init();
if(curl) {
curl_easy_setopt(curl, CURLOPT_URL, "http://example.com");
res = curl_easy_perform(curl);

/* always cleanup */
curl_easy_cleanup(curl);
}
return 0;
}

但是你标记了这个 C++,所以如果你想要 libcurl 的 C++ 包装器,那么使用 curlpp

#include <curlpp/curlpp.hpp>
#include <curlpp/Easy.hpp>
#include <curlpp/Options.hpp>

using namespace curlpp::options;

int main(int, char **)
{
try
{
// That's all that is needed to do cleanup of used resources
curlpp::Cleanup myCleanup;

// Our request to be sent.
curlpp::Easy myRequest;

// Set the URL.
myRequest.setOpt<Url>("http://example.com");

// Send request and get a result.
// By default the result goes to standard output.
myRequest.perform();
}

catch(curlpp::RuntimeError & e)
{
std::cout << e.what() << std::endl;
}

catch(curlpp::LogicError & e)
{
std::cout << e.what() << std::endl;
}

return 0;
}

关于c++ - 将 HTML 源代码读取为字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4370898/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com