- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用 Tensorflow 对我自己的数据集进行神经网络预测。我做的第一个是在我的计算机中使用一个小数据集的模型。在此之后,我稍微更改了代码,以便使用具有更大数据集的 Google Cloud ML-Engine 在 ML-Engine 中实现训练和预测。
我正在对 Pandas 数据框中的特征进行归一化,但这会引入偏斜,我得到的预测结果很差。
我真正想要的是使用库 tf-transform
来规范化图中的数据。为此,我想创建一个函数 preprocessing_fn
并使用“tft.scale_to_0_1
”。 https://github.com/tensorflow/transform/blob/master/getting_started.md
我发现的主要问题是在尝试进行预测时。我正在寻找互联网,但我没有找到任何在训练中对数据进行标准化的导出模型示例。在我发现的所有示例中,数据在任何地方都没有标准化。
我想知道的是如果我在训练中对数据进行归一化并发送一个包含新数据的新实例来进行预测,这些数据是如何归一化的?
可能在 Tensorflow 数据管道中?进行归一化的变量保存在某个地方?
总而言之:我正在寻找一种方法来标准化我的模型的输入,然后新实例也变得标准化。
最佳答案
首先,您实际上并不需要 tf.transform。您需要做的就是编写一个从训练/评估 input_fn 和服务 input_fn 调用的函数。
例如,假设您已在整个数据集上使用 Pandas 来计算最小值和最大值
def add_engineered(features):
min_x = 22
max_x = 43
features['x'] = (features['x'] - min_x) / (max_x - min_x)
return features
然后,在您的 input_fn 中,通过调用 add_engineered 包装您返回的功能:
def input_fn():
features = ...
label = ...
return add_engineered(features), label
并在您的 serving_input fn 中,确保通过调用 add_engineered 类似地包装返回的功能(不是 feature_placeholders):
def serving_input_fn():
feature_placeholders = ...
features = feature_placeholders.copy()
return tf.estimator.export.ServingInputReceiver(
add_engineered(features), feature_placeholders)
现在,您在预测时的 JSON 输入只需要包含原始的、未缩放的值。
这是此方法的完整工作示例。
tf.transform 提供了一个两阶段过程:计算最小值、最大值的分析步骤和将缩放比例插入 TensorFlow 图表的图表修改步骤。因此,要使用 tf.transform,您首先需要编写一个数据流管道来进行分析,然后在您的 TensorFlow 代码中插入对 tf.scale_0_to_1 的调用。这是一个这样做的例子:
https://github.com/GoogleCloudPlatform/cloudml-samples/tree/master/criteo_tft
add_engineered() 方法更简单,也是我的建议。如果您的数据分布会随着时间的推移发生变化,那么您需要使用 tf.transform 方法,因此您希望自动化整个管道(例如,为了持续训练)。
关于python - 使用 tensorflow tf-transform 进行数据规范化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46474658/
我有一段这样的代码。我发现 myResults = writer.getBuffer().toString(); 对某些用例返回 EMPTY STRING,但对其他用例则不返回。 我查看了服务器,但在
如何使用 javascript 通过 id 更改元素中的 -webkit-transform 、-moz-transform 、-o-transform 和 -ms-transform css? 这段
我正在使用 javax.xml.transform.Transformer.transform() 通过 xsl 样式表将一个 xml 转换为另一个 xml。我想以编程方式设置第一级 child 的排
为了使 seaborn.pairplot() 正常工作,在 jupyter notebook 中执行了以下步骤。 /usr/local/lib/python2.7/site-packages/matp
假设这个输入 XML 编写这些代码行: StreamSource source = new StreamSource(new StringReader(/* the above XML*/));
如何在 spring 框架中配置 java.xml.transform.Transformer ?我需要转换器的实例来通过 xslt 将 xml 转换为文本。因此,配置的转换器应该了解 xslt 样式
我一直在核心数据中使用可转换属性,将图像和颜色等复杂对象转换为原始数据。我拿了this ... The idea behind transformable attributes is that you
我正在尝试打开 XML 文件,添加一些更改,然后保存到其他 XML 文件结果。我正在使用标准 javax.xml.parsers.* 和 javax.xml.transform* 类。 但在保存的文档
Transformer(变换方法)对输入源的大小有限制吗? 我正在尝试转换一个相当长的 (18M) XML,但收到一个奇怪的错误 "The element type "HR" must be term
我正在尝试解析一个非常简单的示例: 100 我使用的样式表如下: 这在 libxs
来自文档 for from_pretrained ,我知道我不必每次都下载预训练的向量,我可以使用以下语法保存它们并从磁盘加载: - a path to a `directory` contain
默认缓存目录磁盘容量不足,我需要更改默认缓存目录的配置。 最佳答案 您可以在每次加载模型时指定缓存目录 .from_pretrained通过设置参数cache_dir .您可以通过导出环境变量 TRA
有一个函数,例如: CATransform3DGetAffineTransform Returns the affine transform represented by 't'. If 't' ca
我有一个包含 WCF 设置的配置文件: “add”元素只有一个 baseAddress 属性,所以我不能使用 Match 定位器。一种方法如何像我的示例中那样转换多个元素? 最
在收到下面链接中描述的错误后,我已将实体属性的 Transfomer 设置为 NSSecureUnarchiveFromData(之前为 nil)。 CoreData crash error Xcod
当我写Document时使用 Transformer 的 transform() 方法转换为 XML,生成的 XML 文档的格式很好 - 所有元素都写在单独的行上并缩进。除了第一个元素与定义写在同一行
我不明白 StreamResult 实例会发生什么。我看到 Transformer 对象接收 source 和 streamResult: transformer.transform(sour
从下面的代码片段我应该得出结论,std::transform 比 boost::transform 更受欢迎,因为前者使用更少的初始化和析构函数可能更有效比后者? #include #include
transform() 可以将函数应用到序列的元素上,并将这个函数返回的值保存到另一个序列中,它返回的迭代器指向输出序列所保存的最后一个元素的下一个位置。 这个算法有一个版本和 for_each()
我是 react-native 的新手。在项目上将 react-native 从 0.48.3 升级到 0.62.2 后,运行“react-native run-ios”命令时出现错误:“index.
我是一名优秀的程序员,十分优秀!