gpt4 book ai didi

python - 使用 python 2.7 和正则表达式使用子字符串的开头和结尾(密码子)查找子字符串

转载 作者:太空宇宙 更新时间:2023-11-04 02:57:40 25 4
gpt4 key购买 nike

(python 2.7) 我有一个 RNA 序列,我试图找到所有以 'AUG' 开头并以 'UAG' 或 'UGA' 或 'UAA' 结尾的非重叠子串这就是我正在使用的:

import re
sequence = GAUGCAAAAUAAAUGAUGUAAUAA
search = r"^(AUG(.)*(?:UAG|UAA|UGA))"
regions = re.findall(search, sequence)
print regions

输出应该是“AUGCAAAA”和“AUGAUG”。但是我得到了整个区域 'AUGCAAAAUAAAUGAUGUAAUAA'

最佳答案

看起来你需要使用

AUG.*?(?=UAG|UAA|UGA)

参见 this regex demo

详细信息:

  • AUG - 匹配 AUG
  • .*? - 除了换行符之外的任何 0+ 个字符尽可能少,直到第一个...
  • (?=UAG|UAA|UGA) - UAGUAAUGA(不是返回值的一部分,因为该模式位于零宽度断言的正先行内)。

关于python - 使用 python 2.7 和正则表达式使用子字符串的开头和结尾(密码子)查找子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41902815/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com