tensorflow - TF2 - GradientTape 与 Model.fit() - 为什么 GradientTape 不起作用？-6ren

tensorflow - TF2 - GradientTape 与 Model.fit() - 为什么 GradientTape 不起作用？

转载作者：行者123 更新时间：2023-12-02 16:30:36

25

4

晚上好

我想使用 tf2 和 Gradient Tape 函数为一个简单的回归问题实现一个玩具示例。使用 Model.fit 它可以正确学习，但与 GradientTape 一样可以做一些事情，但与 model.fit() 相比损失不会移动。这是我的示例代码和结果。我找不到问题。

model_opt = tf.keras.optimizers.Adam() 
loss_fn = tf.keras.losses.MeanSquaredError()
with tf.GradientTape() as tape:
    y = model(X, training=True)
    loss_value = loss_fn(y_true, y)
grads = tape.gradient(loss_value, model.trainable_variables)
model_opt.apply_gradients(zip(grads, model.trainable_variables))

#Results:
42.47433806265809
42.63973672226078
36.687397360178586
38.744844324717526
36.59080452300609
...

这里是 model.fit() 的常规情况

model.compile(optimizer=tf.keras.optimizers.Adam(),loss=tf.keras.losses.MSE,metrics="mse")
...
model.fit(X,y_true,verbose=0)
#Results
[40.97759069299212]
[28.04145720307729]
[17.643483147375473]
[7.575242056454791]
[5.83682193867299]

准确率应该是差不多的但是看起来根本就没有学习到。输入 X 是张量，y_true 也是。

编辑用于测试

import pathlib
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

dataset_path = keras.utils.get_file("auto-mpg.data", "http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data")

column_names = ['MPG','Cylinders','Displacement','Horsepower','Weight',
                'Acceleration', 'Model Year', 'Origin']
dataset = pd.read_csv(dataset_path, names=column_names,
                      na_values = "?", comment='\t',
                      sep=" ", skipinitialspace=True)

dataset = dataset.dropna()
dataset['Origin'] = dataset['Origin'].map({1: 'USA', 2: 'Europe', 3: 'Japan'})
dataset = pd.get_dummies(dataset, prefix='', prefix_sep='')

train_dataset = dataset.sample(frac=0.8,random_state=0)
test_dataset = dataset.drop(train_dataset.index)

train_stats = train_dataset.describe()
train_stats.pop("MPG")
train_stats = train_stats.transpose()

train_labels = train_dataset.pop('MPG')
test_labels = test_dataset.pop('MPG')

def norm(x):
  return (x - train_stats['mean']) / train_stats['std']

normed_train_data = norm(train_dataset)
normed_test_data = norm(test_dataset)

def build_model_fit():
  model = keras.Sequential([
    layers.Dense(64, activation='relu', input_shape=[len(train_dataset.keys())]),
    layers.Dense(64, activation='relu'),
    layers.Dense(1)])
  optimizer = tf.keras.optimizers.RMSprop(0.001)
  model.compile(loss='mse',optimizer=optimizer)
  return model

def build_model_tape():
  model = keras.Sequential([
    layers.Dense(64, activation='relu', input_shape=[len(train_dataset.keys())]),
    layers.Dense(64, activation='relu'),
    layers.Dense(1)])
  opt = tf.keras.optimizers.RMSprop(0.001)
  return model, opt

model_f = build_model_fit()
model_g, opt_g = build_model_tape()

EPOCHS = 20

#Model.fit() - Test
history = model_f.fit(normed_train_data, train_labels, epochs=EPOCHS, verbose=2)

X = tf.convert_to_tensor(normed_train_data.to_numpy())
y_true = tf.convert_to_tensor(train_labels.to_numpy())

#GradientTape - Test
loss_fn = tf.keras.losses.MeanSquaredError()
for i in range(0,EPOCHS):
    with tf.GradientTape() as tape:
        y = model_g(X, training=True)
        loss_value = loss_fn(y_true, y)
    grads = tape.gradient(loss_value, model_g.trainable_variables)
    opt_g.apply_gradients(zip(grads, model_g.trainable_variables))
    print(loss_value)

最佳答案

OP 在损失值中看到的差异是由于在 model.fit 和 tf.GradientTape 训练循环中使用了不同的批量大小。如果未指定 model.fit 的 batch_size 关键字参数，则将使用 32 的批处理大小。在 tf.GradientTape 训练循环中，批量大小等于训练集中的样本数(即 314)。

要解决此问题，请在训练循环中实现批处理。一种方法是使用 tf.data API，如下所示。

loss_fn = tf.keras.losses.MeanSquaredError()
for i in range(0,EPOCHS):
    epoch_losses = []
    for x_batch, y_batch in tf.data.Dataset.from_tensor_slices((X, y_true)).batch(32):
        with tf.GradientTape() as tape:
            y = model_g(x_batch, training=True)
            loss_value = loss_fn(y_batch, y)
            epoch_losses.append(loss_value.numpy())
        grads = tape.gradient(loss_value, model_g.trainable_variables)
        opt_g.apply_gradients(zip(grads, model_g.trainable_variables))
    print(np.mean(loss_value))

另请注意，model.fit 会在每次迭代时打乱数据，而自定义训练循环则不会(这需要由开发人员实现)。

关于tensorflow - TF2 - GradientTape 与 Model.fit() - 为什么 GradientTape 不起作用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63550752/

25

4

0

文章推荐： python - 为什么 val_loss 和 val_accuracy 没有出现在时代

google-fit - 在没有 Google Fit 应用的情况下使用 Google Fit API
如果没有 Google Fit 应用程序，是否可以使用 Google Fit API？我想使用 Google Fit API 来计算步数，但是可以在不安装 Google Fit 应用程序的情况下完成
android - Google Fit 停止工作， "Fitness.HistoryApi.insertData"返回成功但未显示在 Google Fit 应用程序中
我的应用程序中实现的代码曾经有效，数据已正确插入/显示在 Google Fit 中，但现在不起作用。我还测试了 BasicHistoryApi 但它不起作用。( https://github.com
android - 以与 Google Fit 应用程序相同的方式获取 Google Fit 历史记录(Google Fit 自动记录的 Activity )
我正在努力显示与 Google Fit 应用程序相同的 Activity 历史记录。我在 session 方面做得很好，但我无法正确掌握自动记录的 Activity 。就像示例中的这两个顶级行走一样。
google-fit - Fit Api 中的距离
我在使用 Google Fit Api 获取行进距离时遇到问题。我对计步器使用了类似的方法并且有效。它只是说听众已注册。大部分代码来自 Github 示例。有什么问题吗？ public class
google-fit - 检索 google fit 步骤时出错
我正在使用此代码尝试检索过去 14 小时内执行的步骤。 YApp myApp = (mYApp) ctx; mGoogleApiClient = myApp.getMyUser();
google-fit - Google Fit API 配额和限制
使用 google fit api 时是否有配额和请求限制？我想使用 google fit api，我很好奇使用它时是否有限制。最佳答案您可以在 Google Developer Console
google-fit - Google Fit API 配额和限制
使用 google fit api 时是否有配额和请求限制？我想使用 google fit api，我很好奇使用它时是否有限制。最佳答案您可以在 Google Developer Console
r - fit$loadings 和 fit$Vaccounted 之间的差异在因素分析中占方差？
无论是使用 fit$loadings 还是使用 fit$Vaccounted 检查它们，我都得到不同的方差值，这些值由因子分析中的因子解释。我正在使用带有 fa() 函数的 psych 包。如果它们应
google-fit - 读取血压和血糖数据来源自 google api Fitness Playground
如果我进入 google api Playground，我会执行以下步骤: 第 1 步:选择并授权 API。我选择两个范围 https://www.googleapis.com/auth/fitnes
android - 如何在 Google Fit 项目的开发者控制台上找到 Fitness API？
我正在执行 https://developers.google.com/fit/android/get-started 中提到的步骤实现一个简单的健身 Android 应用程序。但是当我想这样做的时
google-fit - 通过 Google Fit REST API 访问体重数据
在过去的 6 个月里，我一直在将我的体重输入 Google Fit，现在我想把我的数据拿出来。访问 Google Fit REST API 不是问题。然而，在所有可访问的数据中找到我的体重数据让我很
google-fit - 在哪里为 google fit android 应用程序提供客户端 ID
我最近尝试尝试使用 Google Fit 应用程序并尝试了 Google Fit developer site 中给出的步骤.并使用了 Android 示例中给出的代码 BasicSensorApi在
google-fit - 从 google fit api 获取事件列表(运动)
我正在创建可以使用 google fit api 的应用程序。我想获得 google fit 中可用的所有事件( Action )。这里是 google fit 中的事件列表 Reference 。
python - sklearn.exceptions.NotFittedError : Estimator not fitted, 在利用模型之前调用 `fit`
我尝试了随机森林回归。代码如下。 import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.m
android - Google Fit API : ApiException 17 (Fitness. 客户端在此设备上不可用)
Google Play documentation claims this is an API_NOT_CONNECTED code ，但是为了访问 Google Fit API，我已经完成了我(认为
javascript - 通过 Google Fit Api 检索的卡路里数与 Google Fit 官方应用程序中显示的卡路里数不匹配
我正在使用google javascript api 。为了获取卡路里，我正在使用下一个数据源: 派生:com.google.calories.expished:com.google.android.
android - 通过 Google Fit Api 检索的步数与 Google Fit 官方应用程序中显示的步数不匹配
我开发了一个需要显示每日步数的应用程序。为此，我使用了 Google Fit SDK 中提供的 API。似乎一切正常，但我得到的步数与 Google Fit 官方应用程序中显示的步数不匹配。例如，
android - 通过 Google Fit Android API 检索的每周步数与 Google Fit 官方应用中显示的步数不匹配
我正在尝试从 google fit API 检索用户的每周步数数据，但我从官方 google fit App 数据中获得了不同的步数结果。例如:星期四通过 google fit api 检索到的步数是
java - 自 Google Fit App 更新以来，Google Fit 数据模式发生了变化，实现显然已中断
我们已经在我们的用户群中发现，自上次 google fit 应用程序更新以来，数据急剧下降，自开始以来，我们一直试图找出代码中的问题。给出时间，我们认为我们使用的版本(当时是 18.0)是问题所在。
python & scikit : How to get the parameter of fitted models from Gaussian mixture models fitting?
拟合高斯混合模型(X-Y数据集)后，如何获取每个分布的参数？例如每个分布的均值、标准差、权重和角度？我想我可以找到代码 here : def make_ellipses(gmm, ax):

首页

博学

6Ren·AI

商城

tensorflow - TF2 - GradientTape 与 Model.fit() - 为什么 GradientTape 不起作用？