gpt4 book ai didi

python-pandas创建Series数据类型的操作

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 27 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章python-pandas创建Series数据类型的操作由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

1.什么是pandas

python-pandas创建Series数据类型的操作

2.查看pandas版本信息

print(pd.__version__)

输出:

0.24.1

3.常见数据类型

常见的数据类型

- 一维: Series 。

- 二维: DataFrame 。

- 三维: Panel … 。

- 四维: Panel4D … 。

- N维: PanelND … 。

4.pandas创建Series数据类型对象

1). 通过列表创建Series对象

array = ["粉条", "粉丝", "粉带"]# 如果不指定索引, 默认从0开始;s1 = pd.Series(data=array)print(s1)# 如果不指定索引, 默认从0开始;ss1 = pd.Series(data=array, index=["A", "B", "C"])print(ss1)

输出:

0    粉条1    粉丝2    粉带dtype: objectA    粉条B    粉丝C    粉带dtype: object

2). 通过numpy的对象Ndarray创建Series;

n = np.random.randn(5)   # 随机创建一个ndarray对象;s2 = pd.Series(data=n)print(s2)# 修改元素的数据类型;ss2 = s2.astype(np.int)print(ss2)

输出:

0   -1.6497551    0.6074792    0.9431363   -1.7940604    1.569035dtype: float640   -11    02    03   -14    1dtype: int64

3). 通过字典创建Series对象;

dict = {string.ascii_lowercase[i]:i for i in range(10)}s3 = pd.Series(dict)print(s3)

输出:

a    0b    1c    2d    3e    4f    5g    6h    7i    8j    9dtype: int64

5.Series基本操作

共同部分:

import pandas as pdimport numpy as npimport  stringarray = ["粉条", "粉丝", "粉带"]s1 = pd.Series(data=array)print(s1)

输出:

0    粉条1    粉丝2    粉带dtype: object

1). 修改Series索引.index

print(s1.index) #输出:RangeIndex(start=0, stop=3, step=1)s1.index = ["A", "B", "C"]print(s1) 

输出:

A    粉条B    粉丝C    粉带dtype: object

2). Series纵向拼接.append

s1.index = ["A", "B", "C"]array = ["粉条", "粉丝", "粉带"]# 如果不指定索引, 默认从0开始;s2 = pd.Series(data=array)s3 = s1.append(s2)print(s3)

输出:

A    粉条B    粉丝C    粉带0    粉条1    粉丝2    粉带dtype: object

3). 删除指定索引对应的元素.drop(‘index")

s3 = s3.drop("C")  # 删除索引为‘C"对应的值;print(s3)

输出:

A    粉条B    粉丝0    粉条1    粉丝2    粉带dtype: object

4). 根据指定的索引查找元素

print(s3["B"])   #粉丝s3["B"] = np.nan #索引B处的值替换为缺失值print(s3)

输出:

A     粉条B    NaN0     粉条1     粉丝2     粉带dtype: object

5). 切片操作 ― 同列表

print(s3[:2])  #显示前两个元素print(s3[::-1]) #逆序print(s3[-2:])  # 显示最后两个元素

输出:

A     粉条B    NaNdtype: object-------------------------2     粉带1     粉丝0     粉条B    NaNA     粉条dtype: object-------------------------1    粉丝2    粉带dtype: object

6.Series运算

先设置两个Series对象:

import pandas as pdimport numpy as npimport  strings1  = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))s2  = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))print(s1)print(s2)

python-pandas创建Series数据类型的操作

按照对应的索引进行计算, 如果索引不同,则填充为Nan,

1).加法add

print(s1 + s2)print(s1.add(s2))

输出:

a    NaNb    NaNc    4.0d    6.0e    8.0f    NaNg    NaNh    NaNdtype: float64

2).减法sub

print(s1 - s2)print(s1.sub(s2))

输出:

a    NaNb    NaNc    0.0d    0.0e    0.0f    NaNg    NaNh    NaNdtype: float64

3).乘法mul

print(s1 * s2)print(s1.mul(s2))

输出:

a     NaNb     NaNc     4.0d     9.0e    16.0f     NaNg     NaNh     NaNdtype: float64

4).除法div

print(s1 / s2)print(s1.div(s2))

输出:

a    NaNb    NaNc    1.0d    1.0e    1.0f    NaNg    NaNh    NaNdtype: float64

5).求中位数median

print(s1.median())

输出:

2.0

6).求和sum

print(s1.sum())

输出:

10

7).最大值max

print(s1.max())

输出:

4

8).最小值min

print(s1.min())

输出:

0

7.特殊的where方法

series中的where方法运行结果和numpy中完全不同 。

import pandas as pdimport numpy as npimport strings1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))print(s1)

输出:

a    0b    1c    2d    3e    4dtype: int64
print(s1.where(s1 > 3))

大于3的显示,不大于3的为NaN 。

python-pandas创建Series数据类型的操作

# 对象中小于3的元素赋值为10;print(s1.where(s1 > 3, 10))

python-pandas创建Series数据类型的操作

# 对象中大于3的元素赋值为10;print(s1.mask(s1 > 3, 10))

python-pandas创建Series数据类型的操作

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我。如有错误或未考虑完全的地方,望不吝赐教.

原文链接:https://blog.csdn.net/weixin_43067754/article/details/87969499 。

最后此篇关于python-pandas创建Series数据类型的操作的文章就讲到这里了,如果你想了解更多关于python-pandas创建Series数据类型的操作的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com