sed - 用sed替换2个已知模式之间的可变长度字符串-6ren

sed - 用sed替换2个已知模式之间的可变长度字符串

转载作者：行者123 更新时间：2023-12-04 13:55:23

31

4

我希望能够在2个已知模式之间替换字符串。我要抓住的是，我想用仅由“ x”组成的相同长度的字符串替换它。

假设我有一个包含以下内容的文件：

Hello.StringToBeReplaced.SecondString
Hello.ShortString.SecondString

我希望输出是这样的：

Hello.xxxxxxxxxxxxxxxxxx.SecondString
Hello.xxxxxxxxxxx.SecondString

最佳答案

使用sed循环

您可以使用sed，尽管所需的思想并不完全清楚：

sed ':a;s/^\(Hello\.x*\)[^x]\(.*\.SecondString\)/\1x\2/;t a'

这是针对GNU sed的； BSD（Mac OS X） sed和其他版本可能比较麻烦，并且要求：

sed -e ':a' -e 's/^\(Hello\.x*\)[^x]\(.*\.SecondString\)/\1x\2/' -e 't a'

两者的逻辑是相同的：

创建标签 a
替换引导字符串和 x的序列（捕获1），后跟非 x以及任意其他数据加上第二个字符串（捕获2），然后将其替换为捕获1的内容， x和捕获内容2。
如果 s///命令进行了更改，请返回标签 a。

当两个标记字符串之间没有非 x时，它将停止替换。

对正则表达式的两个调整允许代码在一行上识别模式的两个副本。丢失将匹配锚定到行首的 ^，然后将 .*更改为 [^.]*（这样，正则表达式就不会那么贪心了）：

$ echo Hello.StringToBeReplaced.SecondString Hello.StringToBeReplaced.SecondString |
> sed ':a;s/\(Hello\.x*\)[^x]\([^.]*\.SecondString\)/\1x\2/;t a'
Hello.xxxxxxxxxxxxxxxxxx.SecondString Hello.xxxxxxxxxxxxxxxxxx.SecondString
$

使用容纳空间

hek2mgl建议在 sed中使用保留空间的另一种方法。可以使用以下方法实现：

$ echo Hello.StringToBeReplaced.SecondString |
> sed 's/^\(Hello\.\)\([^.]\{1,\}\)\(\.SecondString\)/\1@\3@@\2/
>      h
>      s/.*@@//
>      s/./x/g
>      G
>      s/\(x*\)\n\([^@]*\)@\([^@]*\)@@.*/\2\1\3/
>      '
Hello.xxxxxxxxxxxxxxxxxx.SecondString
$

该脚本不如循环版本健壮，但可以正常工作，如每行匹配引线中尾模式。首先将线分为三个部分：第一个标记，要被修整的钻头和第二个标记。它进行了重新组织，以使两个标记由 @分隔，然后由 @@和要修饰的位分隔。 h将结果复制到保留空间。删除所有内容，直到 @@；将要替换的位中的每个字符替换为 x，然后在模式空间中的 x之后复制保留空间中的内容，并用换行符分隔它们。最后，识别并捕获 x，前导标记和尾部标记，而忽略换行符， @和 @@以及尾随材料，然后重新组装为前导标记， x和尾巴标记。

为了使其健壮，您需要识别出模式，然后将 {和 }中显示的命令进行分组以将它们分组，以便仅在识别出模式时才执行它们：

sed '/^\(Hello\.\)\([^.]\{1,\}\)\(\.SecondString\)/{
     s/^\(Hello\.\)\([^.]\{1,\}\)\(\.SecondString\)/\1@\3@@\2/
     h
     s/.*@@//
     s/./x/g
     G
     s/\(x*\)\n\([^@]*\)@\([^@]*\)@@.*/\2\1\3/
     }'

调整以适应您的需求...

调整以适应您的需求

[我尝试了您的一种解决方案，但效果很好。]
但是，当我尝试用我的真实字符串替换“ hello”（即
' 1.2.840.'）和我的第二个字符串（只是一个点' .'），一切就停止了
加工。我想所有这些点都会混淆 sed命令。
我试图实现的是将这个' 1.2.840.10008.'转换为
' 1.2.840.xxxxx.'

而且此模式在我的文件中多次发生，且编号可变
' 1.2.840.'和下一个点' .'之间要替换的字符数

在某些情况下，使您的问题足够接近实际情况很重要，这可能就是一个这样的情况。点是的元字符
sed正则表达式（以及大多数其他正则表达式中的方言-shell遍历是明显的例外）。如果“待修改的位”始终是数字，那么我们可以收紧正则表达式，尽管实际上（当我看前面的代码时）收紧实际上并没有太多限制。

几乎所有使用正则表达式的解决方案都是一种平衡行为，必须使便利性和缩写性与可靠性和准确性相抵触。

修改后的代码和数据

cat <<EOF |
transform this '1.2.840.10008.' to '1.2.840.xxxxx.'
OK, and hence 1.2.840.21. and 1.2.840.20992. should lose the 21 and 20992.
EOF

sed ':a;s/\(1\.2\.840\.x*\)[^x.]\([^.]*\.\)/\1x\2/;t a'

输出示例：

transform this '1.2.840.xxxxx.' to '1.2.840.xxxxx.'
OK, and hence 1.2.840.xx. and 1.2.840.xxxxx. should lose the 21 and 20992.

脚本中的更改是：

sed ':a;s/\(1\.2\.840\.x*\)[^x.]\([^.]*\.\)/\1x\2/;t a'

添加 1\.2\.840\.作为开始模式。
将“替换字符”表达式修改为“不是 x或 .”。
仅使用 \.作为尾巴样式。

如果您确定只希望数字匹配，可以用 [^x.]替换 [0-9]，在这种情况下，您不必担心空格，如下所述。

您可能会决定不希望将空格匹配，以便随便添加如下注释：

The net prefix is 1.2.840. And there are other prefixes too.

最终不会是：

The net prefix is 1.2.840.xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.

在这种情况下，您可能需要使用：

sed ':a;s/\(1\.2\.840\.x*\)[^x. ]\([^ .]*\.\)/\1x\2/;t a'

因此，更改将继续进行，直到您拥有足够精确的功能来执行所需的操作，而无需对当前数据集执行任何不需要的操作。编写防弹正则表达式需要对要匹配的内容进行精确说明，并且可能很难。

关于sed - 用sed替换2个已知模式之间的可变长度字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29174646/

31

4

0

文章推荐： Next.js - 是否可以调试 getServerSideProps？

文章推荐： spring-webflux - 如何使用 react 器有条件地重复或重试

文章推荐： SQL 语句获取所有具有所有能力列表的公司

文章推荐： ajax - 使用 Google Chrome 加载指示器

webpack - Webpack:未知参数:模式/配置具有未知属性“模式”
对此感到疯狂，真的缺少一些东西。我有webpack 4.6.0，webpack-cli ^ 2.1.2，所以是最新的。在文档（https://webpack.js.org/concepts/mod
linux - 在文件中的匹配字符串(模式 1)上方打印特定单词直到匹配字符串(模式 2)
object Host "os.google.com" { import "windows" address = "linux.google.com" groups = ["linux"] } obj
android - OpenGLRenderer 刷新缓存(模式 0)和(模式 1)
每当我安装我的应用程序时，我都可以将数据库从 Assets 文件夹复制到 /data/data/packagename/databases/ .到此为止，应用程序工作得很好。但 10 或 15 秒后
xml - emacs:HideShow 是否适用于 xml 模式(sgml 模式)？
我在 cc 模式缓冲区中使用 hideshow.el 来折叠我不查看的文件部分。如果能够在 XML 文档中做到这一点就好了。我使用 emacs 22.2.1 和内置的 sgml-mode 进行 xm
xml - 从 XML 模式 (XSD) 生成 Json 模式
已结束。此问题不符合 Stack Overflow guidelines .它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题，以便用事实和引用来回答它。关闭
java - 为什么使用 useDelimiter(Pattern 模式) 与 useDelimiter(String 模式)
根据java: public Scanner useDelimiter(String pattern) Sets this scanner's delimiting pattern to a patt
php - 为什么 Post/Redirect/Get 模式(PRG 模式)有效？
我读过一些关于 PRG 模式以及它如何防止用户重新提交表单的文章。比如this post有一张不错的图: 我能理解为什么在收到 2xx 后用户刷新页面时不会发生表单提交。但我仍然想知道: (1) 如果
android - 如何在 React Native 中使用 "Spinner"模式 "DatePickerAndroid"而没有任何对话框/模式/弹出窗口？
看看下面的图片，您可能会清楚地看到这一点。那么如何在带有其他一些 View 的简单屏幕中实现没有任何弹出/对话框/模式的微调器日期选择器？我在整个网络上进行了谷歌搜索，但没有找到与之相关的任何合适
Python 模式
我不知道该怎么做，我一直遇到问题。以下是代码: rows = int(input()) for i in range(1,rows): for j in range(1,i+1):
正则表达式重写 AND 模式
我想为重写创建一个正则表达式。将所有请求重写为 index.php(不需要匹配)，它不是以/api 开头，或者不是以('.html'，或'.js'或'.css'或'.png'结束) 我的例子还是这样
30、MVC 模式
MVC模式代表 Model-View-Controller（模型-视图-控制器）模式 MVC模式用于应用程序的分层开发 Model（模型） - 模型代表一个存取数据的对象或 JAVA PO
组织模式的 RDF 模式
我想为组织模式创建一个 RDF 模式世界。您可能知道，组织模式文档基于层次结构大纲，其中标题是主要的分组实体。 * March auxiliary :PROPERTIES: :HLEVEL: 1 :E
值为对象数组的对象的 JSON 模式
我正在编写一个可以从文件中读取 JSON 数据的软件。该文件包含“person”——一个值为对象数组的对象。我打算使用 JSON 模式验证库来验证内容，而不是自己编写代码。符合代表以下数据的 JSON
用于多个多对多关系的 SQL 模式
假设我有 4 张 table 人公司团体和账单现在bills/persons和bills/companys和bills/groups之间是多对多的关系。我看到了 4 种可能的 sql 模式
用于处理多个连接的多值字段的 SOLR 模式
假设您有这样的文档: doc1: id:1 text: ... references: Journal1, 2013, pag 123 references: Journal2, 2014,
JSON 模式 - 多种类型
我有这个架构。它检查评论，目前工作正常。 var schema = { id: '', type: 'object', additionalProperties: false, pro
与参数匹配的 F# 模式
这可能很简单，但有人可以解释为什么以下模式匹配不明智吗？它说其他规则，例如1, 0, _ 永远不会匹配。 let matchTest(n : int) = let ran = new Rand
XML 模式 - 命名空间选择歧义
我有以下选择序列作为 XML 模式的一部分。理想情况下，我想要一个序列: 来自 my:namespace 的元素必须严格解析。来自任何其他命名空间的元素，不包括 ##targetNamespace和
相似对象映射的 json 模式
我希望编写一个 json 模式来涵盖这个(简化的)示例 { "errorMessage": "", "nbRunningQueries": 0, "isError": Fals
永远不会匹配与元组规则匹配的 F# 模式
首先，我是 f# 的新手，所以也许答案很明显，但我没有看到。所以我有一些带有 id 和值的元组。我知道我正在寻找的 id，我想从我传入的三个元组中选择正确的元组。我打算用两个 match 语句来做到这

首页

博学

6Ren·AI

商城

sed - 用sed替换2个已知模式之间的可变长度字符串