python - 为什么keras model.fit with sample_weight 初始化时间长？-6ren

python - 为什么keras model.fit with sample_weight 初始化时间长？

转载作者：行者123 更新时间：2023-12-04 17:26:16

31

4

我正在使用 keras与 tensorflow (版本 2.2.0)后端来训练分类器来区分两个数据集 A 和 B，我已将它们混合到一个 Pandas DataFrame 对象中 x_train (有两列)，并在 numpy 数组中带有标签 y_train .我想进行样本加权，以说明 A 的样本比 B 多得多。此外，A 由两个数据集 A1 和 A2 组成，A1 远大于 A2；我想用我的样本权重来解释这个事实。我在名为 w_train 的 numpy 数组中有样本权重.有大约 1000 万个训练样本。
这是示例代码:

model = Sequential()
model.add(Dense(64, input_dim=x_train.shape[1], activation='relu')) 
model.add(Dropout(0.1))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.1))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.1))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.1))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

model.fit(x_train.iloc, y_train, sample_weight=w_train)

当我使用 sample_weight参数在 model.fit() ，我发现模型拟合初始化(即在 keras 开始显示训练进度之前发生的任何事情)需要很长时间，无法等待 .当我将数据集限制为 1000 个样本时，问题就消失了，但是当我增加到 100000 或 1000000 个样本时，我注意到初始化和拟合时间存在显着差异，因此我怀疑这与数据的方式有关正在加载。然而，仅仅添加 sample_weights 似乎很奇怪。争论会导致如此大的时间差异。
其他信息:我使用 Jupyter 笔记本在 CPU 上运行。
这里有什么问题？有没有办法让我修改训练设置或其他东西以加快初始化(或训练)时间？

最佳答案

该问题是由 TensorFlow 如何验证某种类型的输入对象引起的。当数据确实正确时，这种验证完全是浪费时间(我希望将来能更好地处理)。
为了强制 TensorFlow 跳过此类验证程序，您可以轻松地将权重包裹在 Pandas Series 中 ，例如:

model.fit(x_train.iloc, y_train, sample_weight=pd.Series(w_train))

请注意，在您的代码中您使用的是 metrics关键词。如果您希望在提供的权重上实际加权准确度，请使用 weighted_metrics取而代之的说法。

关于python - 为什么keras model.fit with sample_weight 初始化时间长？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63158424/

31

4

0

文章推荐： azure-functions - Azure 函数无法获取 Azure 函数 URL

文章推荐： python - Pandas 合并具有多列和容差的数据框

java - Spring 上下文不使用 @ContextConfiguration 初始化，而是使用 new ClassPathXmlApplicationContext 初始化
我是 Spring 新手，这就是我想要做的事情: 我正在使用一个基于 Maven 的库，它有自己的 Spring 上下文和 Autowiring 字段。它的bean配置文件是src/test/res
具有动态元素数的python列表文字/初始化
我在我的测试脚本中有以下列表初始化: newSequenceCore=["ls", "ns", "*", "cm", "*", "ov", "ov", "ov", "ov", "kd"] (代表要在控
C++初始化
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Class construction with initial values 当我查看 http://en.
非常量静态成员变量的C++初始化？
我得到了成员变量“objectCount”的限定错误。编译器还返回“ISO C++ 禁止非常量静态成员的类内初始化”。这是主类: #include #include "Tree.h" using n
为非虚拟方法指定的c++初始化
我有如下所示的a.h class A { public: void doSomething()=0; }; 然后我有如下所示的b.h #include "a.h" class b: publi
Kotlin 初始化 : how to fail
我需要解析 Firebase DataSnapshot (一个 JSON 对象)转换成一个数据类，其属性包括 enum 和 list。所以我更喜欢通过传递 DataSnapshot 来手动解析它进入二
JQUERY $(function() { 初始化
我使用 JQuery 一段时间了，我总是使用以下代码来初始化我的 javascript: $(document).ready( function() { // Initalisation logic
cocoa - NSString 初始化
这里是 Objective-C 菜鸟。为什么会这样: NSString *myString = [NSString alloc]; [myString initWithFormat:@"%f", s
cocoa - NSArrayController 初始化
我无法让核心数据支持的 NSArrayController 在我的代码中正常工作。下面是我的代码: pageArrayController = [[NSArrayController alloc] i
javascript - 放大的弹出窗口安装/初始化
我对这一切都很陌生，并且无法将其安装到我的后端代码中。它去哪里？在我的页脚下面有我所有的 JS？比如，这是什么意思: Popup initialization code should be exec
java - 初始化 JFrame
这可能是一个简单的问题，但是嘿，我是初学者。所以我创建了一个程序来计算一些东西，它目前正在控制台中运行。我决定向其中添加一个用户界面，因此我使用 NetBeans IDE 中的内置功能创建了一个 J
Phalcon 初始化()不工作
我有 2 个 Controller ，TEST1Controller 和 TEST2Controller 在TEST2Controller中，我有一个initialize()函数设置属性值。如果我尝
javascript - dependentObservable 初始化
据我所知， dependentObservable 在声明时会进行计算。但如果某些值尚不存在怎么办？例如: var viewModel ={}; var dependentObservable1 =
带有关键字参数的 ruby 初始化
我正在阅读 POODR 这本书，它使用旧语法进行默认值初始化。我想用新语法实现相同的功能。 class Gear attr_reader :chainring, :cog, :wheel de
polymer 初始化(无响应)
我按照 polymer 教程的说明进行操作: https://www.polymer-project.org/3.0/start/install-3-0 (我跳过了可选部分) 但是，在我执行命令“po
kotlin - Kotlin和构造函数，初始化
很抱歉问到一个非常新手的Kotlin问题，但是我正在努力理解与构造函数和初始化有关的一些东西。我有这个类和构造函数: class TestCaseBuilder constructor(
c# - 康威的生命游戏 - 初始化
假设我们有一个包含 30 列和 30 行的网格。生命游戏规则简而言之: 一个小区有八个相邻小区当一个细胞拥有三个存活的相邻细胞时，该细胞就会存活如果一个细胞恰好有两个或三个活的相邻细胞，那么它就
java - 初始化 ByteArrayOutputStream？
我是 MQTT 和 Android 开放附件“AOA” 的新手。在阅读教程时，我意识到，在尝试写入 ByteArrayOutputStream 类型的变量之前，应该写入 0 或 0x00首先到该变量。
Phalcon 初始化()不工作
我有 2 个 Controller ，TEST1Controller 和 TEST2Controller 在TEST2Controller中，我有一个initialize()函数设置属性值。如果我尝
inotify - 初始化:目录创建时的奇怪行为
我有一个inotify /内核问题。我正在使用“inotify” Python项目进行观察，但是，我的问题仍然是固有的关于inotify内核实现的核心。 Python inotify项目处理递归ino

首页

博学

6Ren·AI

商城

python - 为什么keras model.fit with sample_weight 初始化时间长？