gpt4 book ai didi

python - 返回 inf : how can I solve this? 的 pandas DataFrame 列的 mean()

转载 作者:行者123 更新时间:2023-11-28 21:15:02 25 4
gpt4 key购买 nike

我正在尝试实现一些机器学习算法,但在将数据放在一起时遇到了一些困难。

在下面的例子中,我从 UCI 加载了一个示例数据集,删除了缺少数据的行(感谢上一个问题的帮助),现在我想尝试规范化数据。

对于许多数据集,我只是使用:

valores = (valores - valores.mean()) / (valores.std())

但对于这个特定的数据集,上述方法不起作用。问题在于 mean 函数正在返回 inf,这可能是由于精度问题。请参见下面的示例:

bcw = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data', header=None)

for col in bcw.columns:
if bcw[col].dtype != 'int64':
print "Removendo possivel '?' na coluna %s..." % col
bcw = bcw[bcw[col] != '?']

valores = bcw.iloc[:,1:10]
#mean return inf
print valores.iloc[:,5].mean()

我的问题是如何处理这个问题。看来我需要更改此列的类型,但我不知道该怎么做。

最佳答案

不太熟悉 pandas 但如果你转换成一个 numpy 数组它可以工作,试试

np.asarray(valores.iloc[:,5], dtype=np.float).mean()

关于python - 返回 inf : how can I solve this? 的 pandas DataFrame 列的 mean(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30782594/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com