作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
此问题适合那些熟悉 GPT 或 GPT2 的人OpenAI 模型。特别是编码任务(字节对编码)。这是我的问题:
我想知道如何创建自己的 vocab.bpe 文件。
我有一个西类牙语语料库文本,我想用它来适应我自己的 bpe 编码器。我已经成功创建了带有 python-bpe 的编码器.json库,但我不知道如何获取 vocab.bpe 文件。我已经查看了 gpt-2/src/encoder.py 中的代码但是,我还没有找到任何提示。有什么帮助或想法吗?
提前非常感谢您。
最佳答案
查看here ,您可以使用以下命令轻松创建相同的 vocab.bpe:
python learn_bpe -o ./vocab.bpe -i dataset.txt --symbols 50000
关于python - 如何使用我自己的语料库文本创建和拟合 vocab.bpe 文件(GPT 和 GPT2 OpenAI 模型)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55531061/
此问题适合那些熟悉 GPT 或 GPT2 的人OpenAI 模型。特别是编码任务(字节对编码)。这是我的问题: 我想知道如何创建自己的 vocab.bpe 文件。 我有一个西类牙语语料库文本,我想用它
我是一名优秀的程序员,十分优秀!