gpt4 book ai didi

Swift NaturalLanguage 框架错误 “Token SequenceType length is 0"

转载 作者:行者123 更新时间:2023-11-30 11:12:40 25 4
gpt4 key购买 nike

我目前正在使用 Apple 的 CreateML 从我拥有的 JSON 文件生成 NLP 模型。这是我的代码:

import Foundation
import CreateML
import NaturalLanguage

let trainingData = try MLDataTable(contentsOf: Bundle.main.url(forResource: "Fel", withExtension: "json")!)
let model = try MLWordTagger(trainingData: trainingData, tokenColumn: "tokens", labelColumn: "labels")
let metadata = MLModelMetadata(author: "Sai Kambampati", shortDescription: "The Felicity Named Entity Recognizer", license: "MIT", version: "1.0")
try model.write(to: URL(fileURLWithPath: "/Users/SaiKambampati/Desktop/Felicity.mlmodel"), metadata: metadata)

JSON 文件有 116,096 行,Xcode 能够正确解析它。它根据 5% 的数据生成了验证集。然而,当它开始标记数据并提取特征时,我收到一条错误消息:

▿ MLCreateError
▿ 通用:1 个元素
- 原因:“Token SequenceType 长度为 0”

我不知道这意味着什么,也无法在网上找到任何内容!有人可以帮忙吗?

最佳答案

您的 JSON 文件必须采用此格式才能与 MLWordTagger 的 tokenColumn 参数配合使用。标记作为字符串列表,标签作为字符串列表。

[
{
"tokens": [
"Aprender",
"a",
"realizar",
"Aquisição",
"de",
"usuários"
],
"labels": [
"GENERIC_ACTION",
"NONE",
"ACTION",
"TOPIC",
"NONE",
"NONE"
]
}, ...

关于Swift NaturalLanguage 框架错误 “Token SequenceType length is 0",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52028566/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com