gpt4 book ai didi

machine-learning - 训练 SyntaxNet 需要多少数据?

转载 作者:行者123 更新时间:2023-11-30 08:54:15 25 4
gpt4 key购买 nike

我知道数据越多越好,但是训练 SyntaxNet 所需的合理数据量是多少?

最佳答案

根据一些试验和错误,我达到了以下最低要求:

  • 训练语料库 - 18,000 个标记(少于此数量的任何内容以及步骤 2 - 使用标注器进行预处理 - 都会失败)
  • 测试语料库 - 2,000 个标记(少于此数量的任何内容以及步骤 2 - 使用标记器进行预处理 - 失败)
  • 开发语料库 - 2,000 个 token

    但请注意,通过这个,我只设法让 NLP 管道中的步骤运行,实际上我还没有设法从中获得任何可用的东西。

  • 关于machine-learning - 训练 SyntaxNet 需要多少数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41877324/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com