gpt4 book ai didi

python - 将 .tfrecords 文件拆分为多个 .tfrecords 文件

转载 作者:太空宇宙 更新时间:2023-11-03 13:26:34 26 4
gpt4 key购买 nike

有什么方法可以直接将 .tfrecords 文件拆分为多个 .tfrecords 文件,而无需写回每个数据集示例?

最佳答案

在 tensorflow 2.0.0 中,这将起作用:

import tensorflow as tf

raw_dataset = tf.data.TFRecordDataset("input_file.tfrecord")

shards = 10

for i in range(shards):
writer = tf.data.experimental.TFRecordWriter(f"output_file-part-{i}.tfrecord")
writer.write(raw_dataset.shard(shards, i))

关于python - 将 .tfrecords 文件拆分为多个 .tfrecords 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54519309/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com