gpt4 book ai didi

r - 计算分组数据中给定文本的所有出现次数

转载 作者:行者123 更新时间:2023-12-05 09:25:52 25 4
gpt4 key购买 nike

我的部分数据如下:

> q[,c(1,3)]
Year Language
1 1 C++
2 1 C
3 1 C++
4 1 C
5 1 C++
6 1 JavaScript
7 1 C++
8 2 C++
9 2 inny
10 2 C++
11 2 Java
12 3 Java
13 3 Java
14 3 JavaScript
15 3 Java
16 3 JavaScript
17 3 .NET
18 3 inny
19 3 R
20 3 Python
21 3 .NET
22 3 Python
23 3 Java
24 3 Java
25 3 Java
26 3 Java
27 3 Java
28 3 Java
29 3 C#
30 3 C++
31 3 JavaScript
32 3 C++
33 3 JavaScript
34 3 Java
35 3 Java
36 3 Python
37 3 C#
38 4 R
39 4 C
40 4 Java
41 4 Python
42 4 C++
43 4 .NET
44 4 C#
45 5 inny
46 5 JavaScript
47 5 C#
48 5 Python
49 5 R
50 2 C

名为q 的整个数据集还有其他与此处无关的列。我想要实现的是每年统计最常出现的语言。有时会出现几种语言的最高数量相同!这就是为什么我想列出每一种这样的语言。

预期输出:

    Year Language     
1 1 C++
2 2 C++
3 3 Java
4 4 .NET
5 4 C
6 4 C#
7 4 C++
8 4 Java
9 4 Python
10 4 R
11 5 C#
12 5 inny
13 5 JavaScript
14 5 Python
15 5 R

最佳答案

如果需要,包含“数量”列以显示每年出现的每种语言。

library(tidyverse) 

df %>%
count(Year, Language, name = "amount") %>%
group_by(Year) %>%
slice_max(amount)

# A tibble: 15 × 3
# Groups: Year [5]
Year Language amount
<dbl> <chr> <int>
1 1 C++ 4
2 2 C++ 2
3 3 Java 11
4 4 .NET 1
5 4 C 1
6 4 C# 1
7 4 C++ 1
8 4 Java 1
9 4 Python 1
10 4 R 1
11 5 C# 1
12 5 inny 1
13 5 JavaScript 1
14 5 Python 1
15 5 R 1
>

关于r - 计算分组数据中给定文本的所有出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74970288/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com