- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
让x
包含变量:print(x)
Restaurant Cuisines Average_Cost Rating Votes Reviews Area
0 3.526361 0.693147 5.303305 1.504077 2.564949 1.609438 7.214504
1 1.386294 4.127134 4.615121 1.504077 2.484907 1.609438 5.905362
2 2.772589 1.386294 5.017280 1.526056 4.605170 3.433987 6.131226
3 3.912023 2.833213 5.525453 1.547563 5.176150 4.564348 7.643483
4 3.526361 2.708050 5.303305 1.435085 5.948035 5.046646 6.126869
... ... ... ... ... ... ... ...
11089 3.912023 0.693147 5.525453 1.648659 5.789960 5.046646 3.135494
11090 1.386294 6.028279 4.615121 1.526056 3.610918 2.833213 7.643483
11091 1.386294 2.397895 4.615121 1.504077 3.828641 2.944439 5.814131
11092 1.386294 6.028279 4.615121 1.410987 3.218876 2.302585 5.905362
11093 1.386294 6.028279 4.615121 1.029619 0.000000 0.000000 5.564520
11094 rows × 7 columns
并让 y
为多类目标变量。 打印(y.value_counts())
30 minutes 7406
45 minutes 2665
65 minutes 923
120 minutes 62
20 minutes 20
80 minutes 14
10 minutes 4
Name: Delivery_Time, dtype: int64
探索 y
变量后,我们可以看到 30 分钟
类别与其他类别相比具有更高的计数。
为了平衡这些,我尝试 SMOTETomek
对数据进行过采样。但我得到了一个错误:
from imblearn.combine import SMOTETomek
smk = SMOTEtomek(ratio = 1)
x_res, y_res = smk.fit_sample(x,y)
错误:
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-54-426e8b86623d> in <module>()
1 from imblearn.combine import SMOTETomek
2 smk = SMOTETomek(ratio = 1)
----> 3 x_res, y_res = smk.fit_sample(x,y)
2 frames
/usr/local/lib/python3.6/dist-packages/imblearn/utils/_validation.py in _sampling_strategy_float(sampling_strategy, y, sampling_type)
311 if type_y != 'binary':
312 raise ValueError(
--> 313 '"sampling_strategy" can be a float only when the type '
314 'of target is binary. For multi-class, use a dict.')
315 target_stats = _count_class_sample(y)
ValueError: "sampling_strategy" can be a float only when the type of target is binary. For multi-class, use a dict.
最佳答案
您可以看到Smote
的实际实现: https://github.com/scikit-learn-contrib/imbalanced-learn/blob/master/imblearn/utils/_validation.py#L355
您只需传递错误中提到的字典即可。但SMOTE算法内部负责多类设置。
做:
from imblearn.oversampling import SMOTE
smote=SMOTE("minority")
X,Y=smote.fit_sample(x_train,y_train)
When dict, the keys correspond to the targeted classes. The
values correspond to the desired number of samples for each targeted
class.
关于python - 我试图使我的数据平衡,因为我的目标变量具有多类,并且我想对其进行过采样以使我的数据平衡,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58872043/
我是 C++ 的新手,我在使用这段代码时遇到了问题: string output_date(int day, int month, int year){ string date; if
所以我这样做了 tar cvzf test.zip FP 为了创建目录 FP 的 zip 但是,它会列出 zip 中的目录 FP/ FP/php/ FP/php/pdf/ FP/php/docs/ F
我正在尝试在 Swift、Xcode 7.3(所以是 Swift 2.2)中创建一个通用类,但我似乎无法让它通过编译器: protocol Struct1Protocol { } struct Str
我的测试用例是这样的: class FooTest extends PHPUnit_Framework_TestCase { /** @covers MyClass::bar */ f
我正在尝试将brew install wine作为使electron-builder工作的一步。但是我所能得到的只是以下响应: ==> Installing dependencies for wine
我这样做: string[,] string1 = {{"one", "0"},{"Two", "5"},{"Three","1"}}; int b = 0; for(int i = 0; i <=
我正在尝试使用 SetWindowsHookEx 键盘 Hook Notepad.exe。 如您所见,工作线程正在将其 ASCII 代码(即 wParam)发送到指定的服务器。 UINT WINAPI
我正在尝试将 ListView 实现到我的 Fragment 中,但无论我尝试什么,我都会得到一个 NullPointerException。我检查对象是否为 null 并记录是否为 null,看起来
我尝试在一行中对齐两个 div。使用 float left 属性,一切顺利。但是当我在 div 中使用图像时,它开始产生问题。 所以这是我的示例代码:- Some headi
我目前正在使用此代码来获取图像的灰度图像表示并以 (512, 370, 1) 的格式表示它大批。 img_instance = cv2.imread(df.iloc[i][x_col]) / 255.
总结 我正在创建一个简单的应用程序,它允许用户选择一个包含顶级窗口的进程。用户首先键入 native DLL(而非托管 DLL)的路径。然后用户键入将在 Hook 过程中调用的方法的名称。该方法不得返
我是一名优秀的程序员,十分优秀!