- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用 Python
实现用于人脸识别的主成分分析
,而不使用 中已定义的
PCA
方法numpy 或 OpenCV。但我的结果简直就是垃圾。
我阅读了
OpenCV
的 doc 的文档和算法描述。但有些事情还不清楚。
如果X = {x1, x2, ..., xn}
那么我相信它不是计算协方差矩阵时使用的 X 矩阵?但是您必须按照前两个步骤中的说明减去平均值等。
特征向量必须按照特征值降序排列。是否必须一边看对应特征值的绝对值一边排序?无论如何,顺序不是主要问题,因为我绘制了所有特征向量,因此我可以相应地重新排列它们。我认为我犯了一个分析错误。
我实现了以下内容:
MU = X.mean(axis=0)
for i in range(n):
X[i,:] -= MU
S = (np.dot(X, X.T) / float(n))
#Hermitian (or symmetric) matrix.
eigenvalues, eigenvectors = numpy.linalg.eigh(S)
eigenvectors = numpy.dot(X.T, eigenvectors)
for i in range(n):
eigenvectors[:,i] = normalize_vector(eigenvectors[:,i])
请注意,样本值存储在行中而不是列中。因此,
p>X
的形状为 nxd
,其中 n
是样本数量,d
是样本维度。
上图为引用。第一个是均值,后面三个是最大特征向量。下图是我的结果。第一个是均值,下面是按某种顺序排列的所有特征向量。但它们似乎与结果不符。
cv2.PCACompute(X, 6)
仍然会产生更好的结果。
最佳答案
第一个问题回答得很好here .
对于第二个,答案是您需要根据相应特征值的值对特征向量进行排序。为此,您可以使用 python np.argsort()
,然后反转此顺序(argsort 顺序从小到大):
indexes = np.argsort(eigenvalues)[::-1]
eigval = eigenvalues[indexes]
eigvec = eigenvectors[:,indexes]
<小时/>
检查您的代码,我刚刚发现了几个问题:
现在,您将获得所有特征向量,您忽略了nb_components
参数,您应该只采用您所要求的向量。这是用
特征向量 = 特征向量[:,索引][0:nb_components]
对于归一化向量(在 pca 函数内),您使用从 0 到 n 的 for 循环,但如果只要求您提供(比方说)3 个特征向量,您只需要有 3 列。要解决这个问题,请从 0 迭代到 nb_components
。
除此之外,您的代码运行完美。我尝试只使用 3 个主要组件,最终结果为 6/6。在我看来,显示特征向量时的差异只是从 float 转换为 uint8 以使用 imshow 时的表示问题。
关于负特征值,它只是一个 eigh
的问题。由于特征值显示方向上的方差,因此我们关心绝对值,但如果更改符号,我们还必须更改“方向”(特征向量)。您可以将负特征值及其相应的特征向量与 -1.0
相乘(请参阅 this ):
s = np.where(eigenvalues < 0)
eigenvalues[s] = eigenvalues[s] * -1.0
eigenvectors[:,s] = eigenvectors[:,s] * -1.0
您还可以使用 numpy.linalg.svd
( docs ) 解决此问题,但它应该比 numpy.linalg.eigh
慢。
总而言之,这是我从你的代码中得出的代码(我在处理此处时删除了所有注释以使其更短):
def pca(X, nb_components=0):
[n,d] = X.shape
if (nb_components <= 0) or (nb_components>6):
nb_components = n
MU = X.mean(axis=0)
for i in range(n):
X[i,:] -= MU
S = (np.dot(X, X.T) / float(n))
eigenvalues, eigenvectors = np.linalg.eigh(S)
s = np.where(eigenvalues < 0)
eigenvalues[s] = eigenvalues[s] * -1.0
eigenvectors[:,s] = eigenvectors[:,s] * -1.0
indexes = np.argsort(eigenvalues)[::-1]
eigenvalues = eigenvalues[indexes]
eigenvectors = eigenvectors[:,indexes][:,0:nb_components]
eigenvectors = np.dot(X.T, eigenvectors)
for i in range(nb_components):
eigenvectors[:,i] = normalize_vector(eigenvectors[:,i])
return (eigenvalues, eigenvectors, MU)
关于python - Python 中的主成分分析 : Analytical Mistake,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22885100/
最近,我收到了一个项目要求,即从某个页面将数据发送到Google Analytics(分析)。我不知道该怎么做。 帐户ID和所有内容均已创建,我只想知道如何在加载某个网页时发送数据。 我一直在根据自己
我试图在此站点和其他一些站点上找到此问题的答案。但这似乎并不适合我自己。以下网址显示了有关如何同时使用GA和UA的说明。 How to use both ga.js and analytics.js?
从谷歌的文档: The analytics.js snippet is part of Universal Analytics, which is currently in public beta.
根据google的新analytics.js文档,您可以设置多个跟踪器,并通过在单独的send调用中按名称明确提及跟踪器来向其发送事件: https://developers.google.com/a
有什么办法可以让 Google Analytics 的“In-Page Analytics”显示外部链接流量? 实际上,外部链接的综合浏览量会显示在流量报告中,但不会显示在页内分析中。 我们正在使用这
我正在尝试编写一个 Google Analytics API 查询,它只返回去年每个月的每月唯一身份访问者。 This is the data I see in the Google Analytic
我们在我们的应用程序中使用 Google Analytics,但现在我们需要更改它并改用 Adobe Analytics。 在对这两种工具进行比较研究时,我现在意识到了这两种工具的优缺点和特点,
我需要您有关 Google Analytics (analytics.js) 的帮助。我在头部有第一个通用部分,效果很好: (function(i,s,o,g,r,a,m
这个问题在这里已经有了答案: Why use protocol-relative URLs at all? (5 个答案) 关闭 5 年前。 我正在阅读 https://developers.goo
将目标从Analytics(分析)导入到AdWords中,然后在Analytics(分析)中更改目标条件时,是否可以通过更改将目标“重新导入”到AdWords,还是可以自动选择? 最佳答案 更改目标值
Google最近更新了他们对开发人员的政策。 https://play.google.com/about/privacy-security/personal-sensitive/ If your ap
我正在使用google analytics api来获取数据。我正在获取数据,但我想验证两个参数,它们在特定日期范围内始终为0。我正在获取['ga:transactions']和['ga:goalCo
我使用Google API从Google Analytics(分析)获取数据,但指标与Google Analytics(分析)的网络界面不同。 即:我在2015年3月1日获得数据-它返回综合浏览量79
我安装了 Google Analytics (UA) 并将跟踪代码添加到 html 页面。我从浏览器文件中运行 html 页面:///C:/test.html 并使用谷歌调试器进行调试,它成功运行并显
我正在遵循 https://developers.google.com/analytics/devguides/collection/amp-analytics/ 的简单指南 尝试添加 Pagevie
我计划管理大约。通过为每个属性创建带有主机名过滤器的专用 View ,可以在一个属性下创建 400 个差异站点。是否有任何流程可以在不手动创建 View 和制作过滤器的情况下完成此任务? 例如:我们有
我想使用 Google Analytics API 访问 User Explorer 数据,以获取 JSON 值形式的报告。使用此 JSON 值,我可以创建用于分析的 Web 应用程序仪表板。我在此
我正在尝试使用此代码来跟踪 Google Analytics 中的事件 _trackEvent(category, action, opt_label, opt_value, opt_noni
我目前正在使用访问 token 和刷新 token 从 Google Analytics Reporting API (v4) 中提取数据。当我致力于自动从 Google Analytics 中提取数
我正在尝试根据此相关问题实现 anchor (index.html#anchor)跟踪: How to track anchor tags with Google Analytics 我使用 anch
我是一名优秀的程序员,十分优秀!