gpt4 book ai didi

python - 解释 Apache Beam python 语法

转载 作者:IT老高 更新时间:2023-10-28 22:08:24 24 4
gpt4 key购买 nike

我已通读 Beam 文档并查看了 Python 文档,但没有找到对大多数示例 Apache Beam 代码中使用的语法的良好解释。

谁能解释一下 _|>> 在下面的代码中做了什么?引号中的文本(即“ReadTrainingData”)是否有意义,或者可以与任何其他标签交换?换句话说,该标签是如何使用的?

train_data = pipeline | 'ReadTrainingData' >> _ReadData(training_data)
evaluate_data = pipeline | 'ReadEvalData' >> _ReadData(eval_data)

input_metadata = dataset_metadata.DatasetMetadata(schema=input_schema)

_ = (input_metadata
| 'WriteInputMetadata' >> tft_beam_io.WriteMetadata(
os.path.join(output_dir, path_constants.RAW_METADATA_DIR),
pipeline=pipeline))

preprocessing_fn = reddit.make_preprocessing_fn(frequency_threshold)
(train_dataset, train_metadata), transform_fn = (
(train_data, input_metadata)
| 'AnalyzeAndTransform' >> tft.AnalyzeAndTransformDataset(
preprocessing_fn))

最佳答案

Python 中的运算符可以重载。在 Beam 中,|apply 的同义词,它将 PTransform 应用于 PCollection 以生成新的 PCollection>> 允许您命名一个步骤,以便在各种 UI 中更轻松地显示 - |> 之间的字符串仅用于这些显示目的和标识该特定应用程序。

https://beam.apache.org/documentation/programming-guide/#transforms

关于python - 解释 Apache Beam python 语法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43796046/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com