gpt4 book ai didi

julia - 将字符串参数转换为正则表达式

转载 作者:行者123 更新时间:2023-12-02 21:15:26 24 4
gpt4 key购买 nike

学习Python后尝试进入Julia,但我在一些看似简单的事情上遇到了困难。我想要一个函数,它接受字符串作为参数,但使用这些参数之一作为正则表达式来搜索某些内容。所以:

function patterncount(string::ASCIIString, kmer::ASCIIString)
numpatterns = eachmatch(kmer, string, true)
count(numpatterns)
end

这有几个问题。首先,eachmatch 需要一个 Regex 对象作为第一个参数,我似乎不知道如何转换字符串。在 python 中,我会做 r"{0}".format(kmer) - 有类似的东西吗?

其次,我显然不明白 count 函数是如何工作的( from the docs ):

count(p, itr) → Integer

Count the number of elements in itr for which predicate p returns true.

但我似乎无法弄清楚仅计算迭代器中有多少东西的谓词是什么。我可以制作一个简单的计数器循环,但我认为必须内置它。我只是找不到它(尝试过文档,尝试过搜索......但不走运)。

编辑:我也尝试过 numpatterns =eachmatch(r"$kmer", string, true) - 不行。

最佳答案

要将字符串转换为正则表达式,请对该字符串调用 Regex 函数。

通常,要获取迭代器的长度,您可以使用 length 函数。然而,在这种情况下,这并不会真正起作用。 eachmatch 函数返回一个 Base.RegexMatchIterator 类型的对象,该对象没有 length 方法。因此,您可以按照您的想法使用 count。第一个参数(谓词)应该是一个单参数函数,它返回 truefalse,具体取决于您是否想要计算迭代器中的特定项目。在这种情况下,该函数可以简单地是匿名函数 x->true,因为对于 RegexMatchIterator 中的所有 x,我们想要对其进行计数.

因此,鉴于该信息,我会像这样编写您的函数:

patterncount(s::ASCIIString, kmer::ASCIIString) = 
count(x->true, eachmatch(Regex(kmer), s, true))

编辑:我还将第一个参数的名称更改为 s 而不是 string,因为 string 是一个 Julia 函数。如果我们在本例中保留相同的参数名称,则不会发生什么可怕的事情,但通常最好不要将变量名称指定为与内置函数名称相同。

关于julia - 将字符串参数转换为正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31000633/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com