gpt4 book ai didi

python - 如何 "cut off the tail"系列

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:48:08 25 4
gpt4 key购买 nike

我有一个包含 10 个术语及其分数的列表。第一个 x 往往比其余的重要得多。所以我想找到 x。

例如,plotting this list在第三学期后表现出平稳。因此我们保留前 3 项。甚至凭直觉,保留前 3 个术语似乎是合适的。

    badge                                   =>    7.00709342956543
unlocked => 7.00709342956543
foursquare => 5.830315748850505
https => 5.001254081726074
you've unlocked => 4.954763253529866
50xxxxxx badge => 4.954763253529866
all badges => 4.954763253529866
unlocked far => 4.954763253529866
badges => 4.954763253529866
just unlocked => 4.954763253529866

但是如何以编程方式生成此截止值?我更喜欢标准库中可用的东西。

最佳答案

我假设您的“条款”将按您提供的示例中所示的降序排序。我会简单地建立一个增量(比如 0.5),它表示差异小到可以忽略不计。

然后我将遍历术语集合,将它们添加到结果集合中,一旦我在之前看到的术语的“增量”范围内看到一个术语,我就会结束我的迭代并可能从我的术语中删除最后看到的术语生成的集合也是如此。

这有意义吗?

看起来像这样的东西:

delta = 0.5
result = []
for term in termMapSortedKeys:
if (previousTermValue - delta >= termMap[term]):
break
else:
result.append(term)
previousTermValue = termMap[term]
del result[-1]
return result

关于python - 如何 "cut off the tail"系列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16932070/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com