Python 正则表达式 : How to repeat a repeat of a pattern?-6ren

Python 正则表达式 : How to repeat a repeat of a pattern?

转载作者：太空狗更新时间：2023-10-30 02:46:50

29

4

我正在查看一长串 DNA 核苷酸，并正在寻找以起始代码“AAA”开头并以终止代码“CCC”结尾的序列。由于核苷酸以三联体形式出现，因此我找到的每个序列开始和结束之间的核苷酸数必须是三的倍数。

例如，'AAAGGGCCC' 是一个有效序列，但 'AAAGCCC' 不是。

此外，在每个终止码之前，我想要关于特定阅读框的最长链。

例如，如果 DNA 是“AAAGGGAAACCC”，那么“AAAGGGAAACCC”和“AAACCC”在技术上都是有效的，但由于它们共享相同的终止码实例，我只想要最长的 DNA 链“AAAGGGAAACCC” '.另外，如果我的链是 'AAAAGGCCCCC'，我必须返回 'AAAAGGCCC' 和 'AAAGGCCCC'，因为它们在不同的阅读框架中(一个阅读框架是 mod 3，另一个是 mod 1。)

虽然我认为我有代码来搜索满足 3 的倍数要求且不重叠的字符串，但我不确定如何实现保持相同阅读框架的第二个标准。我下面的代码将只返回不重叠的最长字符串，但不区分阅读框架，因此在上面的示例中它会捕获 'AAAAGGCCC' 而不是 'AAAGGCCCC':

match = re.finditer(r"AAA\w{3}{%d}BBB$"% (minNucleotide-6, math.ceil((minNucleotide-6)/3))

抱歉啰嗦了，感谢您的观看!

最佳答案

使用 positive lookahead assertion .这允许您在字符串中的每个字符处重新应用正则表达式，从而可以找到所有重叠的匹配项，因为先行断言不会像普通匹配那样消耗任何字符。由于您仍然需要匹配一些实际文本，您可以使用 capturing group为了那个原因。

由于 re.findall() 返回捕获组的内容而不是完整的正则表达式匹配(它们都是 '')，您可以使用:

>>> import re
>>> re.findall(r"(?=(AAA(?:\w{3})*?CCC))", "AAAAGGCCCC")
['AAAAGGCCC', 'AAAGGCCCC']

作为注释的 Python 函数:

def find_overlapping(sequence):
    return re.findall(
    """(?=        # Assert that the following regex could be matched here:
     (            # Start of capturing group number 1.
      AAA         # Match AAA.
      (?:         # Start of non-capturing group, matching...
       [AGCT]{3}  # a DNA triplet
      )*?         # repeated any number of times, as few as possible.
      CCC         # Match CCC.
     )            # End of capturing group number 1. 
    )             # End of lookahead assertion.""", 
    sequence, re.VERBOSE)

关于Python 正则表达式 : How to repeat a repeat of a pattern?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18680546/

29

4

0

文章推荐： python - 在 python 中解析 Lucene 查询的正确方法是什么？

文章推荐： python - 字典理解中无法访问函数参数

文章推荐： python - 装饰器可以访问类的私有(private)成员吗？

文章推荐： python - 在 cython 类中包装一个预初始化的指针

javascript - 带有影响内部 ng-repeat 逻辑的外部 ng-repeat 项的嵌套 ng-repeat
我的代码 "> 我想做的是如果外层 ng-repeat 中的 n 为 0，则 div.book_container 将如下所示: 否则，di
angularjs:ng-repeat-start 和 ng-repeat-end 带有内部 ng-repeat
嗨，我有一个用于 ng-repeat-start 和 end 的简单用例，并且工作正常，当我想添加内部 ng-repeat 时出现问题。这是我的代码 {{e}} {{obj.descr
Python 正则表达式 : How to repeat a repeat of a pattern?
我正在查看一长串 DNA 核苷酸，并正在寻找以起始代码“AAA”开头并以终止代码“CCC”结尾的序列。由于核苷酸以三联体形式出现，因此我找到的每个序列开始和结束之间的核苷酸数必须是三的倍数。例如，'
jsf - 用户界面 :repeat inside ui:repeat
我有这个: .... #{item.product.codigoProduto} #{m.description} ... listRequ
javascript - "Duplicates in a repeater are not allowed"on ng-repeat
我从服务请求中返回了以下 json 数据: { "entries": [{ "id": 2081, "name": "BM", "niceNam
Aurelia 嵌套 Repeat.for 父 Repeat.for 上下文
在 Aurelia 中嵌套 repeat.for 时，内部 repeat.for 无权访问其父 repeat.for 中使用的变量>. 示例 ${x} - ${y} 在上面的示
javascript - ng-repeat in Repeat 不重复嵌套对象 Angular
我有一个带有类别的对象，在这个对象内部有一个名为 items 的对象，其中包含带有 items 的对象。现在我想重复显示这样的项目: {{cat
javascript - CSS 背景重复 : no-repeat; still repeating
我有... html, body { background-size: contain; background-repeat: no-repeat; } 作为我的 CS
安卓 : Repeating background stops repeating on rotation
我的问题如下:旋转时，由重复图案组成的背景发生变化，因此图案被拉伸(stretch)而不是重复。可能有什么问题？我有这个由重复图案组成的背景: 最佳答案您必须手动设置重复模式: parent =
java - 如何设置background-repeat : no-repeat in element.风格
关于下面的元素如何编辑 element.style？我想要 background-repeat : no-repeat; 不确定从哪里设置它。 element { display: blo
java - RxJava2 : Repeat conditonally/don't repeat in `repeatWhen`
我有一个 Observable，我想定期重复，但仅限于以下条件: apiInterface.getData() // returns Observable ... // processing is h
html - 即使使用 'background-repeat: no-repeat' 也会重复背景图像
我无法停止 td 元素中的图像重复。它看起来很难看。我该如何解决这个问题？我也添加了 background-repeat: no-repeat 代码，但它仍然无法正常工作。请不要建议从我的 td 宽度
css - 哪个更快 : repeating styles or repeating selectors?
我想知道以下哪个示例的效果更好。如果性能相同，哪个读起来更好？示例 1(重复选择器) .helpfulCommenter, .questionTroll { 颜色:#f00； } .question
angularjs-ng-repeat - 引导工具提示不使用角度 ng-repeat 呈现
我正在尝试创建 tooltip对于通过 ng-repeat. 创建的表的第一行但是工具提示没有呈现。 HTML $(document).ready(function () {
javascript - 在另一个 ng-repeat 中使用 ng-repeat
我正在开发一个页面，我需要在其中显示一些框(使用 ng-repeat )，其中包含 channel 信息以及显示位置(城市)。我面临的问题是当我重复第二个 ng-repeat : 这应该获得第一个
javascript - ng-repeat 位于另一个 ng-repeat 内导致分页问题
我在另一个 ng-repeat 中有 ng-repeat，并且两者都有分页数据。主要的工作正常，但 ng-repeat 内的分页数据并不总是工作。它会抛出控制台错误。错误:[$interpolat
javascript - 为所有 ng-repeat 分开 ng-repeat..？
所以我有这个小问题。我对所有项目使用 ng-repeat，我们称它们为国家，每个项目本身都有一个 ng-repeat 作为城市等子类别。我用国家/地区填充下拉菜单。所以我有这样的国家列表: 美国德
javascript - ng-repeat 内 ng-repeat Angular
我有一条从 Angular $resource promise 返回的记录，如下所示。记录是一个数组，每个记录数组中都有另一个变量数组。我尝试在我的 View 中显示如下。 div(ng-repe
angularjs - 如何执行不重复 ng-repeat 元素的 ng-repeat
我需要使用 ng-repeat 来生成多个元素，但这些元素不能分别包装在 div 内(这是用于框布局的目的，其中框布局仅适用于直接子元素)。例如，我需要这个结果: Head 1 Body 1
带有参数 : @repeat(n) 的 Python3 'repeat' 装饰器
我已经看到(很多)许多教程和装饰器的片段 w/和 w/o 参数，包括我认为是规范答案的两个:Decorators with arguments , python decorator arguments

首页

博学

6Ren·AI

商城

Python 正则表达式 : How to repeat a repeat of a pattern?