gpt4 book ai didi

python - 使用 Python 计算数据框中唯一单词的数量

转载 作者:行者123 更新时间:2023-12-04 01:27:35 25 4
gpt4 key购买 nike

我是 Python 新手。我没有解决以下问题:

我得到了代表一系列接触点的这种类型的数据框:

    df = pd.DataFrame({'path' : ['a>b>c','b>b','c>c','b>d','a>c>c']})

path
a>b>c
b>b
c>c
b>d
a>c>c

我需要计算每一行的唯一接触点的数量并获得:

    path    count_unique_touchpoint
a>b>c 3
b>b 1
c>c 1
b>d 2
a>c>c 2

非常感谢。

最佳答案

您可以使用 Series.str.split拆分分隔符 > 周围的字符串,然后使用 Series.apply应用一个自定义函数,将这个系列的每个项目映射到它包含的不同元素的数量。使用:

df["count_unique_touchpoint"] = df["path"].str.split(">").apply(lambda s: len(set(s)))
print(df)

这打印:

    path  count_unique_touchpoint
0 a>b>c 3
1 b>b 1
2 c>c 1
3 b>d 2
4 a>c>c 2

关于python - 使用 Python 计算数据框中唯一单词的数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61609694/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com