- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试从许多连续特征中预测二元(分类)目标,并希望在进入模型拟合之前缩小特征空间。我注意到 SKLearn 的特征选择包中的 SelectKBest 类在 Iris 数据集上有以下示例(它也是从连续特征预测二进制目标):
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
iris = load_iris()
X, y = iris.data, iris.target
X.shape
(150, 4)
X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
X_new.shape
(150,2)
该示例使用 chi2 检验来确定应在模型中使用哪些特征。然而,据我了解,chi2 检验严格用于我们具有预测分类性能的分类特征的情况。我不认为 chi2 测试可以用于这样的场景。我的理解错了吗?可以使用 chi2 检验来检验分类变量是否依赖于连续变量吗?
最佳答案
带有 chi2 检验的 SelectKBest 函数仅适用于分类数据。事实上,只有当特征只有 1 和 0 时,测试的结果才有意义。
如果你稍微检查一下 chi2 的实现您会看到代码只对每个特征应用总和,这意味着该函数只需要二进制值。另外,接收chi2函数的参数表示如下:
def chi2(X, y):
...
X : {array-like, sparse matrix}, shape = (n_samples, n_features_in)
Sample vectors.
y : array-like, shape = (n_samples,)
Target vector (class labels).
这意味着该函数期望接收带有所有样本的特征向量。但稍后在计算预期值时,您会看到:
feature_count = X.sum(axis=0).reshape(1, -1)
class_prob = Y.mean(axis=0).reshape(1, -1)
expected = np.dot(class_prob.T, feature_count)
只有当 X 和 Y 向量只有 1 和 0 时,这些代码行才有意义。
关于python - 使用 chi2 测试进行具有连续特征的特征选择 (Scikit Learn),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49847493/
我刚开始在较小的项目中使用 chi,我很好奇这里是如何处理静态文件服务的。完成它的最短方法是什么? 这是我尝试的文件服务 fs := http.FileServer(http.Dir("static"
我正在使用如下示例代码开发 python tesseract 包: import pytesseract from PIL import Image tessdata_dir_config = "--
转到此处,使用 Chi 渲染器获取基本的 REST 服务。我有以下结构和功能: type Order struct { OrderId uuid.UUID `json
到这里。试图让 chi 渲染器返回 Order 的列表struct 实例并得到一个我不明白的编译器错误: package myapp import ( "net/http" "gith
我正在尝试使用列联表在 Python 中计算卡方值。这是一个例子。 +--------+------+------+ | | Cat1 | Cat2 | +--------+------
在 Golang 应用程序中,我使用带有 mySQL 后端的 gorilla/session 在 session 中存储数据,但我想将数据存储在 chi 路由器上下文中。如何将身份验证 token 字
这个问题已经有答案了: json.Marshal(struct) returns "{}" (3 个回答) 已关闭去年。 考虑 main/entry 函数中的以下代码 r := chi.New
我正在尝试针对 golang chi 服务器 ( https://github.com/go-chi/chi ) 获取跨源请求。浏览器发出的预检请求未获得预期的 header (下面的屏幕截图)。 这
我正在尝试使用 sklearn.svm.SVC 来完成一些文本分类任务。我知道在使用 SVM 建模之前执行特征选择是一项有点值得怀疑的尝试,因为当使用全套特征时性能通常会达到峰值。从学术角度来看,了解
我有一个包含 42 个特征和 1 个标签的数据集。我想在执行决策树之前应用 Spark ML 库的选择方法卡方选择器来检测异常,但在应用卡方选择器期间遇到此错误: org.apache.spark.S
我正在开发具有以下项目结构的 Go Web 应用程序: 用户界面 模板 登录.tmpl 静态的 CSS 主题.css main.go 我的 main.go 代码(为简洁起见只显示相关部分)。我正在使用
如何使用 go-chi 框架的 gzip 中间件启用 gzip 压缩? 尝试使用此处显示的示例: https://github.com/go-chi/chi/issues/204 但是当我检查 cur
运行 dep ensure 后,go-chi 缺少中间件子包。 project-backend | main.go:8:2: cannot find package "github.com/
我正在尝试编写一个 Python 脚本,仅在以 *CHI: 开头的行上标记所有英文单词,并在单词末尾添加“@s:eng”,但代码似乎不起作用。目前,代码如下所示: import re with ope
我正在使用 chi 路由器编写一个网络应用程序,并为数据库连接字符串和 gorilla session mysqlstore 提供全局变量。我想将这些传递给 chi mount 函数而不是使用全局变量
我试图在样本数据上构建逻辑回归模型。 我们可以得到的模型输出是用于构建模型的特征的权重。 我找不到用于估计标准误差、Wald-Chi Square 统计量、p 值等的 Spark API。 我在下面粘
-- routes.go -- package main import ( "hotelsystem/pkg/config" "hotelsystem/pkg/handlers"
-- routes.go -- package main import ( "hotelsystem/pkg/config" "hotelsystem/pkg/handlers"
我是 golang 新手,正在使用 chi 在 golang 中开发一个 Restful 服务。我正在尝试创建一条路线,如下所示: func NewRouter(dm *storage.Dat
我正在为我的应用程序使用 go-chi 路由器,但是如果我将我的路由设置为“/something”,我将无法同时为“/something”和“/something/”提供服务 r := chi.New
我是一名优秀的程序员,十分优秀!