gpt4 book ai didi

c++ - 如何使用 fscanf 提取 html

转载 作者:行者123 更新时间:2023-11-28 07:54:44 25 4
gpt4 key购买 nike

我有一个文件,每一行都有一个.

<div style="random properties" id="keyword1:string id:int">text</div>
<div style="random properties" id="keyword1:string id:int">text</div>
<div style="random properties" id="keyword2:string id:int">text</div>
<div style="random properties" id="keyword2:string id:int">text</div>

我可以使用 fscanf 返回匹配的关键字 1 和关键字 2 的文本和 ID 列表吗?

最佳答案

你可以简单地用正则表达式读取它:

std::string s;
std::regex r( "<div style=\"[^\"]*\" id=\".*(\\d+)\">((?:(?!</div>).)*)</div>" );
while( std::getline(in, s) ) {
std::smatch m;
if( std::regex_match(s, m, r) ) {
std::cout << "id = " << m.str(1) << ", text = " << m.str(2) << std::endl;
} else {
std::cout << "invalid pattern" << std::endl;
}
}

但是如果您想了解更多关于 regex 的信息,请转到 http://en.cppreference.com/w/cpp/regex

关于c++ - 如何使用 fscanf 提取 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12944305/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com