gpt4 book ai didi

java - 将一组文档分成三个不相交的固定数量的集合

转载 作者:行者123 更新时间:2023-12-02 00:15:02 28 4
gpt4 key购买 nike

我有一组文档,其中包含数千个文档。我想把它分成3组,其数量不同但固定。我该怎么做?任何脚本 bash/python/java 或引用链接将不胜感激。

最佳答案

如果你可以随机获取文档,那么在Python中,我会简单地在“set”上使用列表切片:

 set_of_documents = ...  #somehow build the set
list_of_documents = list(set_of_documents)
training = list_of_documents[:ntraining]
development = list_of_documents[-ndev:]
test = list_of_documents[ntraining:-ndev]

关于java - 将一组文档分成三个不相交的固定数量的集合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12007354/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com