c++ - 从字符串中删除 BBcode-6ren

c++ - 从字符串中删除 BBcode

转载作者：行者123 更新时间：2023-11-28 07:52:16

26

4

所以看起来这个问题已经被问到太阳下的几乎所有语言......除了 C++。我有一个 XML 文档，在文本节点中存储了一些 bbcode。我正在寻找删除它的最佳方法，我想我会在这里查看是否有人知道一些预构建的库或一些自己完成此操作的有效方法。我正在考虑删除介于“[”和“]”字符之间的任何内容，但是，使用提供给我的 XML 文档这会变得疯狂，因为 BB 的许多实例都采用 '[[blahblahblah]]' 的形式。还有一些'[blahblahblah].'

这是 XML 文档。 <text> 之间的所有数据标签被添加到字符串中，有什么建议吗？

<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.7/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.7/ http://www.mediawiki.org/xml/export-0.7.xsd" version="0.7" xml:lang="en">
 <page>
   <title>Human Anatomy/Osteology/Axialskeleton</title>
   <ns>0</ns>
   <id>181313</id>
   <revision>
      <id>1481605</id>
      <parentid>1379871</parentid>
      <timestamp>2009-04-26T02:03:12Z</timestamp>
      <contributor>
          <username>Adrignola</username>
          <id>169232</id>
      </contributor>
      <minor />
      <comment>+Category</comment>
      <sha1>hvxozde19haz4yhwj73ez82tf2bocbz</sha1>
      <text xml:space="preserve"> [[Image:Axial_skeleton_diagram.svg|thumb|240px|right|Diagram of the axial skeleton]]

       The Axial Skeleton is a division of the human skeleton and is named because it makes up the longitudinal ''axis'' of the body. It consists of the skull, hyoid bone, vertebral column, sternum and ribs. It is widely accepted to be made up of 80 bones, although this number varies from individual to individual.

       [[Category:{{FULLBOOKNAME}}|{{FULLCHAPTERNAME}}]]</text>
   </revision>
  </page>
  <page>
    <title>Horn/General/Fingering Chart</title>
    <ns>0</ns>
    <id>23346</id>
    <revision>
        <id>1942387</id>
        <parentid>1734837</parentid>
        <timestamp>2010-10-02T20:21:09Z</timestamp>
        <contributor>
            <username>Nat682</username>
            <id>144010</id>
        </contributor>
        <comment>added important note</comment>
        <sha1>lana7m8m9r23oor0nh24ky45v71sai9</sha1>
        <text xml:space="preserve">{{HornNavGeneral}}
     The horn spans four plus octaves depending on the player and uses both the treble and bass clefs. In this chart it is assumed the player is using a double-horn with F and Bb sides. The number 1 indicates that the index-finger valve should be depressed, the number 2 indicates that the middle-finger valve should be depressed and the number 3 indicates that the ring-finger valve should be depressed. There are eight possible valve combinations among the first, second and third valves: 0, 1, 2, 3, 1-2, 1-3, 2-3, and 1-2-3. However, there are effectively seven combinations, because 1-2 will produce the same notes, perhaps slightly out of tune, as 3 alone. One depresses the thumb key to use the Bb side of the horn.
    [[Image:Fingering chart.png]]
    [[Category:Horn]]</text>
    </revision>
  </page>
</mediawiki>

因此，如果您查看每个 <page> 的底部标签，你会看到像[[Category:{{FULLBOOKNAME}}|{{FULLCHAPTERNAME}}]]这样的东西这就是我要删除的内容。

最佳答案

我假设数据是以您可以读取的迭代器的形式提供给您的。如果您以 std::string 的形式获取它，那么获取一个您可以读取的迭代器非常容易。

在那种情况下，你想要的是一个提升filter_iterator:http://www.boost.org/doc/libs/1_39_0/libs/iterator/doc/filter_iterator.html

你想要的过滤功能很简单。您跟踪看到了多少 [ 并减去看到了多少 ](停在 0 处)。当您的计数为正时，您可以过滤掉该字符。

如果您不能使用 boost，但您是从 std::string 获取它，那么，这有点棘手。但只有一点点。 std::copy_if 有效。

如果您使用的是 C++11，lambda 会让这一切变得非常简单。如果没有，您将不得不编写自己的仿函数来计算 [s.

作为一个简单案例的具体示例:您被输入一个 std::string 并且想要生成一个没有任何 [ ] 分隔内容。

struct SquareBracketStripper
{
  enum { open_bracket = '[', close_bracket = ']' };
  size_t count;
  SquareBracketStripper():count(0) {}
  bool operator()(char c)
  {
    bool skip = (count > 0) || c == open_bracket;
    if (c == open_bracket) {
      ++count;
    } else if (c== close_bracket && count > 0) {
      --count;
    }
    return skip;
  }
};

std::string FilterBBCode( std::string input ) {
  input.erase(input.end(), std::remove_if( input.begin(), input.end(), SquareBracketStripper() ) );
  return input;
}

它处理任意深度的嵌套 []。

filter_iterator 的帮助在于您永远不必将整个字符串加载到内存中，如果您不知道输入的格式有多么不正确，这将非常有用。不需要将几 TB 的数据从磁盘加载到内存中以过滤掉 []，因为您可以流式传输这些内容并即时进行过滤。但是您的用例可能并不真正关心。

关于c++ - 从字符串中删除 BBcode，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13537992/

26

4

0

文章推荐： c++ - 在指定元素前插入节点

文章推荐： html - Mac 上 Safari 中的布局问题

文章推荐： javascript - jQuery 无法选择子项

文章推荐： html - 嵌套表格内的弹出框落后于外表

iPhone:删除/删除 SQLite 数据库？
我知道如何通过iPhone开发创建sqlite数据库、向其中插入数据、删除行等，但我试图以编程方式删除整个数据库本身，但没有得到任何帮助。请有人指导我如何通过代码从设备中删除/删除整个 sqlite
teradata - 删除/删除 Teradata 中的数据库
请帮助指导如何在 Teradata 中删除数据库。当我运行命令DROP DATABASE database_name时，我收到错误消息: *** Failure 3552 Cannot DROP d
azure - 删除/删除 Azure 警报规则
Azure 警报规则的删除命令似乎不起作用，尝试了下面的方法，它返回状态为无内容，并且警报未被删除使用的命令Remove-AzAlertRule -ResourceGroup "RGName"-Na
elasticsearch - Elasticsearch 数据丢失/删除/删除
我在 flex 搜索中为大约50000个视频建立了索引，但是当它达到52000左右时，所有数据都被删除。嗯，这对我来说真的很奇怪，我没有为ES设置任何Heap大小或最小或最大大小的内存大小，因此它们没
python - Django:删除/删除 slug
我正在处理的问题是表单错误“输入由字母、数字、下划线或连字符组成的有效‘slug’。” 以下是我的表单字段验证: def clean_slug(self): slug = self.c
jQuery 删除 : $ ("..."). 删除() 与 .remove ("...")
阅读文档，我希望 $("#wrap2").remove(".error") 从中删除所有 .error 元素#wrap2。然而看看这个 JSFiddle: http://jsfiddle.net/h
php - 删除/删除 laravel 项目
嗨，我第一次尝试发现 laravel 我从 laravel 4.2 开始，我刚刚创建了一个新项目，但我误以为我写了这样的命令行 composer create-project laravel/lara
Apache 2.4 - 删除 |删除 |卸载
我已经在网上搜索了很长一段时间，但我找不到如何完全删除 apache 2.4 。使用: Windows 7 c:\apache24\ 我已经尝试了所有命令，但没有任何效果。 httpd -k shu
python - 删除/删除 pandas DataFrame 中任意列中具有特定字符串的行
可能是一个简单的答案，所以提前道歉(最少的编码经验)。我正在尝试从任何列中删除具有特定字符串(经济 7)的任何行，并且一直在尝试离开此线程: How to drop rows from pandas
c++ - 删除/删除 vector 项的最有效/最快的方法
有几种方法可以删除/移除 vector 中的项目。我有一个指针 vector ，我需要在类的析构函数中删除所有指针。什么是最有效/最快甚至最安全的方式？ // 1º std::for_each(v
linux - 删除 xinetd 导致 plesk 删除
我安装了一个 VNC 服务器并在某处阅读了我必须安装 xinetd 的信息。稍后我决定删除 VNC 服务器，所以我也删除了 xinetd。似乎 xinetd 删除了一些与 plesk 相关的文件，如果
android - 如何完全杀死/删除/删除/停止 AsyncTask
我制作了一个从我们的服务器下载视频的应用。问题是: 当我取消下载时，我打电话: myAsyncTask.cancel(true) 我注意到，myAsyncTask 并没有在调用取消时停止...我的 P
machine-learning - 删除/删除 Vertica 中的机器学习模型(如果存在)
是否可以在使用DELETE_MODEL删除模型之前检查模型是否存在我试图避免在尝试删除尚未创建的模型时收到错误消息。基本上我正在寻找对应的: DROP TABLE IF EXISTS 但对于模型。最
php - 如何使用 php 删除/删除 mySQL 中的特定表行？
我已经有了这个代码: 但它仍然会生成一个表行条目。我想做的是，当输入的数量为0时，表行将被删除。请耐心等待，因为我是 php 和 mySQL 编码新手。最佳答案您忘记执行查询。应该是 $que
c# - 删除 EWS 中的 Exchange 事件修改/删除(即恢复事件)
在 SharePoint 中，如果您删除/修改重复日历条目的单次出现，则不会真正删除/修改任何内容 - 相反，会创建一个新条目，告诉 SP 对于特定日期，该事件不存在或具有新参数. 因此，这可以通过删
javascript - Laravel 5.2 & Dropzone.js - 删除(删除)上传的图片
在 routes.php 中我有以下路由: Route::post('dropzone', ['as' => 'dropzone.upload', 'uses' => 'AdminPhotoContr
Node.JS app.get 错误..无法获取/删除/删除/15
在我的应用程序中，我正在尝试删除产品。当我第一次删除产品时，它会成功并且 URL 更改为/remove_category/15。我正在渲染到同一页面。现在，当我尝试删除另一个产品时，网址更改为/rem
bash - 匹配后如何使用 BSD/OS X sed 删除/删除 X 行
这个问题被问了很多次，但给出的答案都是 GNU sed 特定的。 sed -i '' "/${FIND}/,+2d""$FILE" 给出“预期的上下文地址”错误。有人可以给我一个例子，说明如何使用
javascript - Google Maps JavaScript API V3 - 卸载/解构/删除/删除
在使用 V3 API 时，我找不到任何方法来删除和清理 Google map 。我已经在 AJAX 站点中运行它，所以我想完全关闭它而无需重新加载页面。我希望有一个 .unload() 或 .de
sql-server - 如何创建一个可以创建/更改/删除 View 但不能表、可以读取数据但不能插入/更新/删除/截断数据的 Azure SQL 数据库用户？
是否可以创建一个 Azure SQL 数据库用户来执行以下操作: 针对所有表和 View 进行 SELECT 创建/更改/删除 View 但用户不应该不拥有以下权限: 针对任何表或 View 插入/更

首页

博学

6Ren·AI

商城

c++ - 从字符串中删除 BBcode