python - 依赖于计算 groupby 对象中两个列单元格之间差异的列-6ren

python - 依赖于计算 groupby 对象中两个列单元格之间差异的列

转载作者：太空宇宙更新时间：2023-11-04 01:53:25

25

4

我需要一些提示来进行计算。

我有一个如下所示的 DataFrame:

text_id      user     date        important_words
1            John    2018-01-01   {cat, dog, puppy}           
1            John    2018-02-01   {cat, dog}
2            Anne    2018-01-01   {flower, sun}
3            John    2018-03-01   {water, blue}
3            Marie   2018-05-01   {water, blue, ocean}
3            Kate    2018-08-01   {island, sand, towel}
4            Max     2018-01-01   {hot, cold}
4            Ethan   2018-06-01   {hot, warm}
5            Marie   2019-01-01   {boo}

在给定的数据框中:

text_id是指文本的id:不同id的文本是不同的文本。 user 列是指编辑文本(添加和删除重要词)的用户的名称。 date 列指的是进行编辑的时间(请注意，对每个文本的编辑是临时排序的)。最后，important_words 列是用户编辑后出现在文本中的一组重要词。

我需要计算每个用户在页面的每个版本上添加了多少个单词。

这里的预期输出是:

text_id      user     date        important_words        added_words
1            John    2018-01-01   {cat, dog, puppy}      3        
1            John    2018-02-01   {cat, dog}             0
2            Anne    2018-01-01   {flower, sun}          2
3            John    2018-03-01   {water, blue}          2
3            Marie   2018-05-01   {water, blue, ocean}   1
3            Kate    2018-08-01   {island, sand, towel}  3
4            Max     2018-01-01   {hot, cold}            2
4            Ethan   2018-06-01   {hot, warm}            1
5            Marie   2019-01-01   {boo}                  1

请注意，第一次编辑文本是创建，因此添加的单词数始终是在这种情况下设置的 important_words 的大小。

任何有关计算 added_words 列的最快方法的提示都将受到高度赞赏。

注意 important_words 列包含一个集合，因此计算两个连续版本之间差异的操作应该很容易。

最佳答案

很难思考但很有趣 :-) 我正在使用 get_dummies，然后我们只保留每列的第一个 1 值并对它们进行求和

s=df.important_words.map(','.join).str.get_dummies(sep=',')
s.mask(s==0).cumsum().eq(1).sum(1)
Out[247]: 
0    3
1    0
2    2
3    2
4    1
5    3
6    2
7    1
8    1
dtype: int64
df['val']=s.mask(s==0).cumsum().eq(1).sum(1)

更新

s=df.important_words.map(','.join).str.get_dummies(sep=',')
s.mask(s==0).groupby(df['text_id']).cumsum().eq(1).sum(1)

关于python - 依赖于计算 groupby 对象中两个列单元格之间差异的列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57479656/

25

4

0

文章推荐： html - 似乎无法将内容与单元格顶部对齐

文章推荐： javascript - 使用ES6语法和动态路径导入模块

html - 影响每第三个元素/格
我已经尝试在我的 CSS 中添加一个元素来删除每三个 div 的 margin-right。不过，似乎只是出于某种原因影响了第 3 次和第 7 次。需要它在第 3、6、9 等日工作... CSS .s
animation - CSS3 格 'pulse'
如何使 div/input 闪烁或“脉冲”？例如，假设表单字段输入了无效值？最佳答案使用 CSS3 类似 on this page ，您可以将脉冲效果添加到名为 error 的类中: @-webk
R 格 : Removing the wireframe mesh
我目前正在尝试构建一个简单的 wireframe来自 lattice 的情节包，但由沿 y 轴的数百个点组成。这导致绘图被线框网格淹没，您看到的只是一个黑色块。我知道我可以用 col=FALSE 完全
CSS 格[编号| ="subPane"]错误
在知道 parent>div CSS 选择器在 IE 中无法识别后，我重新编码我的 CSS 样式，例如: div#bodyMain div#paneLeft>div{/*styles here*/}
html - CSS 格 :hover exclusion
我有两个 div，一个在另一个里面。当我将鼠标悬停到最外面的那个时，我想改变它的颜色，没问题。但是，当我将鼠标悬停到内部时，我只想更改它的颜色。这可能吗？换句话说，当将鼠标悬停到内部 div 上
flutter - 格 subview 构建器，其项目的随机宽度 flutter
我需要展示这样的东西有人可以帮忙吗？我可以实现以下输出我正在使用以下代码:: GridView.builder( scrollDirection: Axis.vertical,
android - 复制键盘布局，向上插入 Bottom Sheet 格
当 Bottom Sheet 像 Android 键盘一样打开时，是否有任何方法可以手动上推布局( ScrollView 或回收器 View 或整个 Activity )？或者你可以说我想以 Bott
css - Safari 4 格 :hover Support
我有以下代码，用于使用纯 HTML 和 CSS 显示翻转。当您将鼠标悬停在文本上时，它会更改左右图像。在我测试的所有浏览器中都运行良好，Safari 4 除外。据我收集的信息，Safari 4 支持
html - 带 Bootstrap 的图像，打破列/格
我构建了某种 CMS，但在使用 TinyMCE 和 Bootstrap 时遇到了一些问题。我有一个页面，其中概述了一个 div，如果用户单击该 div，他们可以从模态中选择图像。该图像被插入到一个
CSS 格 :hover with transition only applying to one element?
出于某种原因，当我设置一个过渡时，当我的鼠标悬停在一个元素上时，背景会改变颜色，它只适用于一个元素，但它们都共享同一个类？任何帮助我的 CSS .outer_ad { position:rel
android-studio - 缺少 Android Studio 调试监 window 格
好吧，这真的很愚蠢。我不知道 Android Studio 中的调试监视框架发生了什么。我有 1.5.1 的工作室。是否有一些来自 intellij 的 secret 知识来展示它。最佳答案与以
css - 3 格 : one centered and the two others one in each side
我有这个标记: some code > 我正在尝试获取此布局: 注意:上一个和下一个按钮靠近#player 我正在尝试这样: .nextBtn{
CSS 格 :hover per menu item having Child and Sibling Selectors issue
网站:http://avuedesigns.com/index 首页有 6 个菜单项。我希望每件元素在您经过时都有自己的颜色。这是当您将鼠标悬停在 div 上时将所有内容更改为白色的行 li#hom
php - 在 Joomla 中，如何为 index.php 创建 3x3(9 格)代码？
我需要在 index.php 文件中显示它，但没有任何效果。我所有的文章都没有正确定位。我将其用作代码: 最佳答案您可以首先检查您

首页

博学

6Ren·AI

商城

python - 依赖于计算 groupby 对象中两个列单元格之间差异的列