python - 如何使用十进制数/数据与 python 3 检查相关性-6ren

python - 如何使用十进制数/数据与 python 3 检查相关性

转载作者：太空狗更新时间：2023-10-29 18:06:26

25

4

感谢您的宝贵时间。

我正在编写一些代码来检查多组数据之间的相关性。当我使用原始数据时效果很好(老实说我当时不确定它是哪种格式)，但是在我使用 Decimal 模块通过一些方程运行数据后，数据集在测试时不会显示用于相关性。

我觉得自己真的很愚蠢而且很陌生，哈哈，我相信这是一个非常容易解决的问题。

这是我写的一个小程序来证明我的意思。

from decimal import Decimal
import numpy as np
import pandas as pd

a = [Decimal(2.3), Decimal(1.5), Decimal(5.7), Decimal(4.6), Decimal(5.5), Decimal(1.5)]
b = [Decimal(2.1), Decimal(1.2), Decimal(5.3), Decimal(4.4), Decimal(5.3), Decimal(1.7)]

h = [2.3,1.5,5.7,4.6,5.5,1.5]
j = [2.1,1.2,5.3,4.4,5.3,1.7]

corr_data1 = pd.DataFrame({'A': a, 'B': b}) 

corr_data2 = corr_data1.corr()
print(corr_data2)

corr_data3 = pd.DataFrame({'H': h, 'J': j})

corr_data4 = corr_data3.corr()
print(corr_data4)

列表 A 和 B 以及 H 和 F 的数据完全相同，唯一的区别是 A 和 B 是十进制格式的数字，而 H 和 F 不是。

程序运行时，A&B返回:

Empty DataFrame
Columns: []
Index: []

H & J 返回:

          H         J
H  1.000000  0.995657
J  0.995657  1.000000

如何制作它以便在通过我的方程式运行数据后可以利用这些数据？

很抱歉提出这个愚蠢的问题，感谢您抽出宝贵的时间。希望你们一切都好，节日快乐!

最佳答案

Pandas 无法将数据识别为数值。以下是将数据转换为 float 的方法。

corr_data1.astype(float).corr()

#           A         B
# A  1.000000  0.995657
# B  0.995657  1.000000

这也应该有效，但实际上无效。

pd.to_numeric(corr_data1['A'], errors='coerce')

# 0   NaN
# 1   NaN
# 2   NaN
# 3   NaN
# 4   NaN
# 5   NaN

关于python - 如何使用十进制数/数据与 python 3 检查相关性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41205001/

25

4

0

文章推荐： angular - 在垫日历中突出显示某些日期

文章推荐： python - NumPy:使用 'np.save()' 和 'allow_pickle=False' 的后果

r - 来自矩阵的 Spearman 相关性
我有一个如下所示的数据框: Samples GENE GEN1 GEN2 GEN3 GEN4 GEN5 Sample1 21.0 160 110 3.90 2.62 16.5 Sa
elasticsearch - 基于大多数匹配的查询的 Elasticsearch 相关性
我有以下映射 posts":{ "properties":{ "prop1": { "type": "nested", "properties": { "item
r - 相同维度的两个矩阵之间的 Spearman 相关性
我有两个维度相等的矩阵(p 和 e)，我想在同名的列之间建立斯 PIL 曼相关。我想在矩阵 (M) 中输出对相关性我使用了 Psych 库中的 corr.test() 函数，这是我所做的: libr
r - 相同维度的两个矩阵之间的 Spearman 相关性
我有两个维度相等的矩阵(p 和 e)，我想在同名的列之间建立斯 PIL 曼相关。我想在矩阵 (M) 中输出对相关性我使用了 Psych 库中的 corr.test() 函数，这是我所做的: libr
stata - 如何导出 Spearman 相关性
我正在尝试使用 estpost 和 community-contributed 命令将 Spearman 相关矩阵导出到 rtf 或 Excel 文件中 esttab。但是，我收到以下错误: inv
mysql - ORDER BY 相关性，同时使用参数化值
我在网上找到了以下查询: SELECT company_title FROM companies WHERE company_title like '%gge%' GROUP BY compa
mysql - 如何构建即时搜索引擎？ (具有排名/相关性)
我是 Sphinx 和 Lucene 的重度用户。Sphinx 只需要一个数据库，对其进行索引。然后您调用 Sphinx 获取 ID。但是，如果我想创建一个非常微型的搜索引擎怎么办？就几行数据，几
相关性/匹配值(value)树算法
是否有我要在下面描述的模式/算法的名称？... 假设您有一棵像这样的相关数据树: IDEs Visual Studio Visual Studio 2008 Visual Studio 2010 Ec
linux - 两列之间的 Pearson 相关性
早上好。这是我的问题:我有几个文件，如下所示: 104 0.1697 12.3513214 15.9136214 112 -0.3146 12.0517303 14.8027303 122 0.271
elasticsearch - ES function_score中_score(相关性)的值范围是多少？
在尝试将function_score与boost_mode: "sum"一起使用时(因为这样可以更轻松地跟踪不同的贡献)，我想归一化查询相关性对整体文档分数的影响，但是为此，我需要知道它可以取什么值。
java - mahout Spearman 相关性 java
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
python - scipy:spearmanr 返回值的重要性(相关性)
X,Y 的 spearmanr(Spearman 相关性)输出为我提供以下信息: 相关性:0.54542821980327882 P 值:2.3569040685361066e-65 其中 len(X
python - 部分日期的 Pandas DataFrame 相关性
我有一个 Pandas 数据框，它有一个七年时间范围内的日期时间索引和 10 种不同 Assets 的价格数据。我想运行 dataframe.corr 函数来评估 Assets 之间的关系，我的问题是
algorithm - 字符串比较算法，相关性， "alike"2个字符串是多少
我有相同数据(公司)的 2 个信息源，我可以通过唯一 ID(契约(Contract)号)将它们连接在一起。第二个不同来源的存在是由于这两个来源是手动独立更新的。所以我在 2 个表中有一个 ID 和一个
php - PHP 中的 Pearson 相关性
我正在尝试在php中实现两组数据之间人员相关系数的计算。我只是想做可以在这个 url 上找到的移植 python 脚本 http://answers.oreilly.com/topic/1066-ho
PHP 和 Elasticsearch 在返回的对象中包含分数/相关性
所以我使用 PHP Symfony 和 Ongr-Elasticsearch 包来查询我的文档并返回匹配的对象。结果似乎按相关性/分数排序，但实际相关性/分数不包含在对象本身中。这可能吗？我想将分数
python - Pandas 滚动窗口 Spearman 相关性
我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和/或 Pearson 相关性。我试过df['corr'] = df['col1'].rolling(P).corr(df['
r - 找到最佳方法来计算 R 中数百万个组合的最高 Pearson 相关性
我正在处理一个大型数据集。不过，我将从一个小示例开始，以说明我要实现的目标。我有以下向量: season %group_by(season, round, team)%>%dplyr::mutate
c# - .AspNetCore.相关性。未找到国家属性(property)。未知位置
我正在使用 OIDC 的混合身份验证流程。 options.Events.OnRedirectToIdentityProvider = redirectContext =>
elasticsearch - Elasticsearch 错误- undefined variable [相关性]
我正在尝试查询我的产品ElasticSearch索引并创建一个script_score，但我一直收到错误Variable [relevancy] is not defined. 我尝试只用一个数字替换

首页

博学

6Ren·AI

商城

python - 如何使用十进制数/数据与 python 3 检查相关性