gpt4 book ai didi

python - 计算字段中单词/字符的出现次数

转载 作者:行者123 更新时间:2023-12-02 16:03:08 25 4
gpt4 key购买 nike

我有类似于以下示例的网站访问者数据:

<表类="s-表"><头>id页数<正文>001/ice-cream,/bagels,/bagels/flavors002/pizza,/pizza/flavors,/pizza/recipe

我想转换到下面,在这里我可以计算他们访问我网站中处理特定内容的部分的次数。以逗号分隔的所有网页浏览量的一般计数也很好。

<表类="s-表"><头>idbagel_count<正文>00120020
<表类="s-表"><头>idpizza_count<正文>00100023
<表类="s-表"><头>idtotal_pages_count<正文>00130023

我可以选择在 SQL 或 Python 中执行,但我不确定哪个更容易,因此我问这个问题的原因。

我引用了以下问题,但它们不符合我的目的:

最佳答案

我们可以先split 然后explode 然后用crosstab 得到你的结果

df['pages'] = df.pages.str.split(r'[/, ]')
s = df.explode('pages')
out = pd.crosstab(s['id'], s['pages']).drop('', axis=1)
out
Out[427]:
pages bagels flavors ice-cream pizza recipe
id
1 2 1 1 0 0
2 0 1 0 3 1

关于python - 计算字段中单词/字符的出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70156620/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com