- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用 Python
实现用于人脸识别的主成分分析
,而不使用 中已定义的
PCA
方法numpy 或 OpenCV。但我的结果简直就是垃圾。
我阅读了
OpenCV
的 doc 的文档和算法描述。但有些事情还不清楚。
如果X = {x1, x2, ..., xn}
那么我相信它不是计算协方差矩阵时使用的 X 矩阵?但是您必须按照前两个步骤中的说明减去平均值等。
特征向量必须按照特征值降序排列。是否必须一边看对应特征值的绝对值一边排序?无论如何,顺序不是主要问题,因为我绘制了所有特征向量,因此我可以相应地重新排列它们。我认为我犯了一个分析错误。
我实现了以下内容:
MU = X.mean(axis=0)
for i in range(n):
X[i,:] -= MU
S = (np.dot(X, X.T) / float(n))
#Hermitian (or symmetric) matrix.
eigenvalues, eigenvectors = numpy.linalg.eigh(S)
eigenvectors = numpy.dot(X.T, eigenvectors)
for i in range(n):
eigenvectors[:,i] = normalize_vector(eigenvectors[:,i])
请注意,样本值存储在行中而不是列中。因此,
p>X
的形状为 nxd
,其中 n
是样本数量,d
是样本维度。
上图为引用。第一个是均值,后面三个是最大特征向量。下图是我的结果。第一个是均值,下面是按某种顺序排列的所有特征向量。但它们似乎与结果不符。
cv2.PCACompute(X, 6)
仍然会产生更好的结果。
最佳答案
第一个问题回答得很好here .
对于第二个,答案是您需要根据相应特征值的值对特征向量进行排序。为此,您可以使用 python np.argsort()
,然后反转此顺序(argsort 顺序从小到大):
indexes = np.argsort(eigenvalues)[::-1]
eigval = eigenvalues[indexes]
eigvec = eigenvectors[:,indexes]
<小时/>
检查您的代码,我刚刚发现了几个问题:
现在,您将获得所有特征向量,您忽略了nb_components
参数,您应该只采用您所要求的向量。这是用
特征向量 = 特征向量[:,索引][0:nb_components]
对于归一化向量(在 pca 函数内),您使用从 0 到 n 的 for 循环,但如果只要求您提供(比方说)3 个特征向量,您只需要有 3 列。要解决这个问题,请从 0 迭代到 nb_components
。
除此之外,您的代码运行完美。我尝试只使用 3 个主要组件,最终结果为 6/6。在我看来,显示特征向量时的差异只是从 float 转换为 uint8 以使用 imshow 时的表示问题。
关于负特征值,它只是一个 eigh
的问题。由于特征值显示方向上的方差,因此我们关心绝对值,但如果更改符号,我们还必须更改“方向”(特征向量)。您可以将负特征值及其相应的特征向量与 -1.0
相乘(请参阅 this ):
s = np.where(eigenvalues < 0)
eigenvalues[s] = eigenvalues[s] * -1.0
eigenvectors[:,s] = eigenvectors[:,s] * -1.0
您还可以使用 numpy.linalg.svd
( docs ) 解决此问题,但它应该比 numpy.linalg.eigh
慢。
总而言之,这是我从你的代码中得出的代码(我在处理此处时删除了所有注释以使其更短):
def pca(X, nb_components=0):
[n,d] = X.shape
if (nb_components <= 0) or (nb_components>6):
nb_components = n
MU = X.mean(axis=0)
for i in range(n):
X[i,:] -= MU
S = (np.dot(X, X.T) / float(n))
eigenvalues, eigenvectors = np.linalg.eigh(S)
s = np.where(eigenvalues < 0)
eigenvalues[s] = eigenvalues[s] * -1.0
eigenvectors[:,s] = eigenvectors[:,s] * -1.0
indexes = np.argsort(eigenvalues)[::-1]
eigenvalues = eigenvalues[indexes]
eigenvectors = eigenvectors[:,indexes][:,0:nb_components]
eigenvectors = np.dot(X.T, eigenvectors)
for i in range(nb_components):
eigenvectors[:,i] = normalize_vector(eigenvectors[:,i])
return (eigenvalues, eigenvectors, MU)
关于python - Python 中的主成分分析 : Analytical Mistake,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22885100/
我定义了一个自定义比较器来按长度对我的对象的名称(字符串)变量进行排序。 这是我的 person 类的代码: class MyNameLengthCompare implements Comparat
我的 R 代码是: means_log_adj mistake in factor > (mydata_adj$Response_EP, labels = > c("non-responder",
我有 3 个 Activity A、B 和 C。 对于 A,我调用 B,对于 B,我调用 C。(每次都使用示例按钮)。 我想用 C 的按钮调用 Activity A,所以我这样写: Intent in
Errore query SQL: CREATE TABLE `hospital_jqm`.`users` ( `id` INT NOT NULL AUTO_INCREMENT PRIMARY KE
我不得不再次沉浸在 C++ COM 编程中,并且忘记了上次的大部分辛苦教训。 (当我认为“再也不会”这个短语可能被错误使用时。) 用C++开发COM最常见的错误和反模式有哪些?我正在使用 Borlan
我用 C 语言编写了这个“mergesort”。我认为在将元素复制回原始数组时存在错误。有人能帮我吗? 非常感谢。 enter code here /************************
我正在使用 Python 实现用于人脸识别的主成分分析,而不使用 中已定义的 PCA 方法numpy 或 OpenCV。但我的结果简直就是垃圾。 我阅读了 OpenCV 的 doc 的文档和算法描述。
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
基本上,我想创建一个程序来查找两个坐标的斜率。我已经做到了,但是我想让程序询问是否要重新启动,例如查找另一个斜率,而无需用户退出并重新打开程序。 这是我的代码,减去所有不必要的位: import ja
所以我知道这是非常具体的,但由于我对网站编程几乎不熟悉,我希望你能帮助我:)我正在尝试将 jekyll-lunr-js-search ( https://github.com/slashdotdash
我理解为什么 Python 在引用实例属性时需要显式 self 限定符。 但我经常忘记它,因为我在 C++ 中不需要它。 我以这种方式引入的错误有时很难发现;例如,假设我写 if x is not N
对于文件: Year Grade 2000 100 2002 95 2001 88 2012 99 2000 66 等等,我创建了一个函数来计算接下来每年的平均成绩。然而,我发现我不是在最
https://projecteuler.net/problem=18 给定一个整数三角形,问题是找到从上到下的最大路径和(其中路径中的所有数字必须相邻)。 我有一个算法的想法:从最顶层开始,计算左右
当通过命令行使用 python 时,如果我在嵌套语句的前一行看到错误,是否有任何方法可以删除或编辑已经输入的该行? 例如: >>> file = open("file1", "w") >>> for
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
免责声明:我是 REST 思想流派的新手,我正在努力理解它。 所以,我正在阅读此页,Common REST Mistakes ,我发现我对与 session 无关的部分感到完全困惑。页面内容如下: T
我正在尝试用 C 语言解决一个简单的问题,如下所示: Any integer P, such that 0 maxDiff) maxIndex = i; } return maxIn
所以我已经编写了游戏。你轮流与电脑对抗,挑选 1-3 根吸管,游戏的重点是留给对手 1 根吸管。整个部分都有效,但现在我必须对计算机进行编程,以便通过连续播放变得更聪明。 但是,我并不完全确定这是如何
我无法为 CALayer 的 initWithLayer:(layer) 选择器找到任何我可以覆盖的等效绑定(bind)方法。 查看 Monotouch 程序集,选择器 initWithLayer 绑
我是一名优秀的程序员,十分优秀!