gpt4 book ai didi

python-2.7 - 快速实现单词的字符n-gram

转载 作者:行者123 更新时间:2023-12-03 08:26:19 26 4
gpt4 key购买 nike

我编写了以下代码来计算字符二元组,并且输出如下。我的问题是,如何获得不包含最后一个字符(即t)的输出?有没有一种更快,更有效的方法来计算字符n-gram?

b='student'
>>> y=[]
>>> for x in range(len(b)):
n=b[x:x+2]
y.append(n)
>>> y
['st', 'tu', 'ud', 'de', 'en', 'nt', 't']

这是我想要得到的结果: ['st','tu','ud','de','nt]
预先感谢您的建议。

最佳答案

生成二元组:

In [8]: b='student'

In [9]: [b[i:i+2] for i in range(len(b)-1)]
Out[9]: ['st', 'tu', 'ud', 'de', 'en', 'nt']

概括为另一个 n:
In [10]: n=4

In [11]: [b[i:i+n] for i in range(len(b)-n+1)]
Out[11]: ['stud', 'tude', 'uden', 'dent']

关于python-2.7 - 快速实现单词的字符n-gram,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18658106/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com