c++ - 根据 CPlusPlus.com 使用 std::regex_iterator<std::string::iterator>-6ren

c++ - 根据 CPlusPlus.com 使用 std::regex_iterator

转载作者：行者123 更新时间：2023-11-30 01:50:44

29

4

我正在阅读有关 std::regex_iterator<std::string::iterator> 的文档因为我正在尝试学习如何使用它来解析 HTML 标签。网站给出的例子是

#include <iostream>
#include <string>
#include <regex>

int main ()
{
  std::string s ("this subject has a submarine as a subsequence");
  std::regex e ("\\b(sub)([^ ]*)");   // matches words beginning by "sub"

  std::regex_iterator<std::string::iterator> rit ( s.begin(), s.end(), e );
  std::regex_iterator<std::string::iterator> rend;

  while (rit!=rend) {
    std::cout << rit->str() << std::endl;
    ++rit;
  }

  return 0;
}

( http://www.cplusplus.com/reference/regex/regex_iterator/regex_iterator/ )

我有一个问题:如果 rend从未初始化，那么它是如何在 rit!=rend 中有意义地使用的？？

另外，我应该使用什么工具来从 HTML 标记中获取属性？我想要做的是使用 "class='class1 class2' id = 'myId' onclick ='myFunction()' >" 这样的字符串并分成两对

( "class" , "class1 class2" ), ( "id" , "myId" ), ( "onclick" , "myFunction()" )

然后从那里与他们一起工作。我打算使用的正则表达式是

([A-Za-z0-9\\-]+)\\s*=\\s*(['\"])(.*?)\\2

因此我计划遍历该类型的表达式，同时跟踪我是否仍在标记中(即我是否传递了 '>' 字符)。这样做会不会太难？

感谢您为我提供的任何指导。

最佳答案

“如果 rend 从未初始化”是什么意思？显然，std::regex_iterator<I>有一个默认的构造函数。由于迭代只是前向迭代，所以结束迭代器只需要是适合检测结束被使用的东西。默认构造函数可以设置rend相应地。

这是标准 C++ 库中其他几个地方使用的习语，例如 std::istream_iterator<T> .理想情况下，可以使用不同的类型来指示结束迭代器(例如，请参阅 Eric Niebler's discussion 关于此问题，链接是四页中的第一页)，但标准目前要求在使用算法时这两种类型匹配。

关于使用正则表达式解析 HTML 请引用 this answer .

关于c++ - 根据 CPlusPlus.com 使用 std::regex_iterator<std::string::iterator>，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27094037/

29

4

0

文章推荐： c++ - 扫描字符串字符的 ASCII 值

文章推荐： android - 像健身应用程序中的位置跟踪

文章推荐： android - 用于收集 PIL 逊相关系数的 API

文章推荐： c++ - 为什么返回值优化发生在这里

c++ - regex_iterators 可以用于自定义字符串类型吗？
我只找到了 regex_iterators 被初始化为的例子 regex_iterator:: 如果我有一个包含一系列字符的类，例如: class fooString { private: de
c++ - 为 regex_iterator 使用自定义迭代器的问题
我想对要跳过文本中某些字符的文本进行正则表达式搜索。此处提出的原始问题:Regular Expression library that maintains state, takes input cha
C++ 从 regex_iterator 获取匹配项
我试图通过逐行读取文件来从文件中获取一些匹配项。我的代码是这样的: std::regex e("id=\"(.+?)\"|title=\"(.+?)\"|summary=\"(.+?)\"|first
c++ - 遍历 boost regex_iterator 结果
我需要一些帮助来了解如何迭代 boost::sregex_iterator 的搜索结果。基本上我传递了一个';'从命令行分隔的一组 IP 地址，我希望能够使用 boost::sregex_iterat
c++ - 为什么 std::regex_iterator 会导致此数据的堆栈溢出？
我一直在使用 std::regex_iterator 来解析日志文件。我的程序已经运行了几个星期并且已经解析了数百万行日志，直到今天，当今天我针对日志文件运行它并出现堆栈溢出时。事实证明，只有日志文件
c++ - Visual Studio regex_iterator 错误？
我在使用 Visual Studio 2013，我看到了一个我认为是错误的东西，我希望有人可以确认吗？ string foo{ "A\nB\rC\n\r" }; vector bar; for (sr
c++ - regex_token_iterator 和 regex_iterator 有什么区别？
regex_token_iterator 和 regex_iterator 有区别吗？看起来他们都做同样的工作，但不确定哪一个性能更好？最佳答案两者之间确实存在差异，如果我们查看 cpprefe
c++ - 在 istream 上使用 regex_iterator
我希望能够解决这样的问题:Getting std :: ifstream to handle LF, CR, and CRLF? istream 需要用复杂的定界符标记；这样，标记化 istream
c++ - Boost::regex_iterator 构造函数失败但 make_regex_iterator 函数成功
std::string line; 这会抛出 std::runtime_error what(): Memory exhausted: regex_it = boost::sregex_iterat
c++ - 如何使用 C++ Boost 的 regex_iterator()
我正在使用 Boost 来匹配字符串中的子字符串。 Io 遍历结果，我需要使用 regex_iterator() . 那是我找到的唯一用法示例，但我不理解回调。有人可以给我一个函数的用法示例吗？让我
c++ - 用 gcc 编译 std::regex_iterator
我可以使用 g++ -c test.cpp -std=c++0x 创建 .o 文件，但无法链接它，出现下一个错误: test.cpp:(.text+0xe5): undefined reference
c++ - 在 C++ 中使用 regex_iterator 的确切方法是什么？
我一直在寻找一种计算字符串中特定类型的子字符串数量的好方法，比如说，我想计算字符串 'smstyuismsms' 中 'sms' 的出现次数。我在有人建议使用 regex_iterator 的论坛中找
c++ - 尝试比较 regex_iterators 时为 "Invalid operands to binary expression ..."
我有几行简单的代码 std::regex_iterator regit (attributesStart, _curIter, _attributeRegex), regend(s
c++ - 根据 CPlusPlus.com 使用 std::regex_iterator
我正在阅读有关 std::regex_iterator 的文档因为我正在尝试学习如何使用它来解析 HTML 标签。网站给出的例子是 #include #include #include int

首页

博学

6Ren·AI

商城

c++ - 根据 CPlusPlus.com 使用 std::regex_iterator