gpt4 book ai didi

python - 在 python 中使用 pandas 计算均值和标准差

转载 作者:太空宇宙 更新时间:2023-11-04 03:17:54 25 4
gpt4 key购买 nike

我在计算均值和标准差时遇到了问题。

我通过

加载了一个 CSV
df = pandas.read_csv("fakedata.csv", skiprows=1, header=None)

然后是方法

df.mean()

什么也没给我。这是raw data的链接.

>>> df.mean()
Series([], dtype: float64)

我也检查了计数。

>>> df.count()
0 40000
dtype: int64

我的操作系统是 Centos6.7,python 2.7,pandas 0.17.1

pip show pandas
---
Metadata-Version: 2.0
Name: pandas
Version: 0.17.1
Summary: Powerful data structures for data analysis, time series,and statistics
Home-page: http://pandas.pydata.org
Author: The PyData Development Team
Author-email: pydata@googlegroups.com
License: BSD
Location: /usr/local/lib/python2.7/site-packages
Requires: pytz, python-dateutil, numpy

[编辑]dataframe信息显示

>>> df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 40000 entries, 0 to 39999
Data columns (total 1 columns):
0 40000 non-null object
dtypes: object(1)
memory usage: 625.0+ KB

和数据框形状显示

>>> df.shape
(40000, 1)

最佳答案

我认为问题在于分隔符。将您的文件复制并粘贴到 .csv 文件中,我可以通过以下方式阅读它:

df = pandas.read_csv("fakedata.csv", skiprows=1, header=None, sep='\s+')

得到结果:

In [18]: df.mean()
Out[18]:
0 50.574475
1 49.585400
2 169.478500
3 59.544800
4 119.814275
5 79.557500
6 79.497775
dtype: float64

和:

In [19]: df.std()
Out[19]:
0 19.787459
1 19.762996
2 14.997920
3 10.034209
4 40.013550
5 19.887973
6 14.947894
dtype: float64

关于python - 在 python 中使用 pandas 计算均值和标准差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35649613/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com