r - 在R中的数据集中以相等的间隔计算总数的百分比-6ren

r - 在R中的数据集中以相等的间隔计算总数的百分比

转载作者：行者123 更新时间：2023-12-01 12:27:17

25

4

我正在处理一个数据集，其中包含每个 FMCG 类别的总数以及每个主要 channel 的销售分布，如列中所示。摘录如下

CTY  totsal MTsal   GTsal   Othsal  totsal  MTsal   GTsal   Othsal
     food   food    food    food    deo      deo    deo      deo
Arg  47313  19620   15052   12641   178      113    41       24
Aus  143140 85172   4634    53334   459      438    5        16
Bel  125399 82966   7818    34614   424      229    5        190

在我的输出数据集中，我想计算每 4 列中的总类别组的份额，例如totsal 食物和totsal deo。因此，这些份额必须为 1，而 channel 的份额加起来必须是它们各自的值(value)。我正在查看的示例输出是:

CTY totshar MTshar  GTshar  Othshar totshar MTshar  GTshar  Othshar
    food    food    food    food    deo      deo    deo      deo
Arg  1      0.4     0.3     0.3     1.0      0.6    0.2      0.1
Aus  1      0.6     0.0     0.4     1.0      1.0    0.0      0.0
Bel  1      0.7     0.1     0.3     1.0      0.5    0.0      0.4

上面的例子是一个摘录，我需要灵活地包含尽可能多的类别和国家。

最佳答案

你可以这样做。首先，我复制并粘贴了您的数据:

d <- read.table("clipboard",header=T)
d
   CTY totsal MTsal GTsal Othsal totsal.1 MTsal.1 GTsal.1 Othsal.1
1 <NA>   food  food  food   food      deo     deo     deo      deo
2  Arg  47313 19620 15052  12641      178     113      41       24
3  Aus 143140 85172  4634  53334      459     438       5       16
4  Bel 125399 82966  7818  34614      424     229       5      190

然后我将数字转换为数字矩阵

m <- data.frame(d[-1, -1])
m <- t(apply(m, 1, function(x) as.numeric(as.character(x))))
m
    [,1]  [,2]  [,3]  [,4] [,5] [,6] [,7] [,8]
2  47313 19620 15052 12641  178  113   41   24
3 143140 85172  4634 53334  459  438    5   16
4 125399 82966  7818 34614  424  229    5  190

我使用 grep 搜索了总列数，并创建了一个索引 gr对于列组。值得注意的是，total列必须始终是组的第一列。组值的总数可以变化。

gr_total <- grep("tot", colnames(d)[-1])
gr <- sort(rep(gr_total, 4))

我用了sapply计算每组的百分比并使用 matrix 转换结果功能。 sapply 函数“循环”遍历 grep 找到的所有组搜索。 function(x, y, z)内它子集属于该组的所有列。此处为先m[, gr == gr_total[1]] .因为 R 针对矢量化过程进行了优化，所以您可以将矢量/矩阵除以矢量。尝试 m[, gr == gr_total[1]]/m[ , gr_total[1]] .对于 matrix()功能请看?matrix并检查 sapply输出。

matrix(sapply(gr_total, function(x, y, z)  z[, y==x]/z[, x], gr, m), nrow(m), ncol(m), byrow = FALSE)
     [,1]      [,2]       [,3]      [,4] [,5]      [,6]       [,7]       [,8]
[1,]    1 0.4146852 0.31813666 0.2671782    1 0.6348315 0.23033708 0.13483146
[2,]    1 0.5950258 0.03237390 0.3726003    1 0.9542484 0.01089325 0.03485839
[3,]    1 0.6616161 0.06234499 0.2760309    1 0.5400943 0.01179245 0.44811321

您可以使用 round函数四舍五入一位数。假设您将结果保存在 m1 中使用 round(m1, 1) .Colnames 可以替换为 colnames(m1) <- colnames(d)[-1] .要添加列和行，请参阅 rbind和 cbind .

关于r - 在R中的数据集中以相等的间隔计算总数的百分比，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38094087/

25

4

0

文章推荐： java - LinearLayout 无法转换为我创建的类

文章推荐： Azure 虚拟机 CPU 核心限制

文章推荐： java - 在 Spring 中实现 JpaRepostiory 时使用存储库注释

文章推荐： c++ - 将当前模板用作模板参数之一的模板参数

mysql - SQL 总数
+--------+-------+----------+-----------+ | Maker | Model | SeatType | NoOfSeats | +--------+------
javascript - jquery 总数
如何使用 jQuery 计算 p 标签之间的字符数？我尝试: DEMO html: 1 1 1 js: var tBytes = 0, tFiles = $('b').length; fo
MongoDB - 聚合框架(总数)
在 MongoDB 上运行正常的“查找”查询时，我可以通过在返回的游标上运行“计数”来获得总结果计数(不考虑限制)。因此，即使我将结果集限制为 10(例如)，我仍然可以知道结果总数为 53(再次，例如
google-sheets - 如何让条形图数据标签在谷歌表格中显示值和百分比(总数)？
在 100% 堆叠条形图中，如何让数据标签同时显示值和总百分比？示例:129 (60.3%) 当您将鼠标悬停在栏上时，它会显示在工具提示中，但在栏本身上不可见。此处示例:https://docs.g
elasticsearch - 与Kibana进行的 session 总数
我在Kibana中的总和有问题。我的用例是，我的每个服务器都会定期报告打开的 session 数。在Kibana中，我想可视化所有服务器上所有 session 的总数。但是，即使只有一台服务器联机且
javascript - 回发后保留计算的 jQuery 总数
我正在使用 jQuery 和 ASP.NET MVC 3 以及 razor View 引擎。我有几个可以在其中输入数值的文本框。我有一个标签控件，其中包含由 jQuery 计算的文本框总数。我有以
PHP/MySQL 总数(按成员)
像这样的结果: 75 Ansari 5 10 88 Koodoo 4 0 90 Koodoo 14 0 83 Koodoo 5 0
c - 如何获取使用的运算符(operator)总数？
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
php - 查找事件 session 总数
我是 PHP 的初学者，我正在为我的网站编写一些代码。我想获得当时处于事件状态的 session 总数。我知道这是一项艰巨的任务，但有可能。我该怎么做？我google了一下，有人说可以通过统计tem
mysql - 在正确的记录行显示 COUNT() 总数
1。问题陈述我很难在正确的记录行中显示 COUNT() 的总数。如何将 COUNT() 显示到正确的相应服务 2。背景我想根据stage_id 和分解到project_name 显示员工负责的项
mysql - 使用mysql在一个查询中选择多个表中的 child 总数
我整个下午都在尝试处理一个(或两个或三个)查询，以便获得三个表的所有子表的计数。看看我的设计: 用户表 id_user | name 1 | foo 2 | bar 获奖表 id_won | user
excel - VBA excel计算文件夹(和文件)总数
我有以下脚本。想要文件夹、子文件夹和文件的数量: Sub CountFiles(ByVal path1 As String) Dim fso As Object Dim subfolder As Ob
sum - 饼图标题中的 c3.js 总数
我对 c3.js 中的饼图有疑问。如何在标题中添加饼图的总数？ var title = new Array('data1.sql','data2.sql') var dtitle = new Arr
sql - 使用 CONNECT BY 在分层查询的每个级别获取计数/总数
我在这方面玩得很开心。我正在尝试针对具有递归关系(分层)的表编写查询(使用 Oracle)，并获取存储在树中每个节点及其下方的另一个表中的记录总数。另一个表只有与叶节点相关的记录。但是，我想获得树中每
angularjs - 获取您的应用程序/模块中的绑定(bind)总数
有没有办法获取模块在任何时间点使用的绑定(bind)总数(通过模板的 {{ .. }}/ng-xxx="..." 、 $scope.$watch(...) 等)？最佳答案使用 document.g
javascript - 表页脚中的 Ruby on Rails 总数
我有一个非常简单的表格，因为我现在真的只是在玩 RoR，只是收集一些数据并将其插入数据库，没有什么令人兴奋的只是基本的 CRUD。但是，我想在表格的页脚中放置一个总和字段，但我在网上找不到任何接近的东
mysql - COUNT 组的 mysql 总数
这个 mysql 查询给出了我的产品的销售数量(total 和total_staff)，按一天中的天数和小时数分组。我想要每个产品的 total 和 total_staff 的总和(不按任何内容分组，
python - 尝试计算 View 总数 - 在模板中显示空白
我正在尝试计算 For 循环中每个 user_name 赢得的总金额，并将其显示在 Amount Won: 之后。但是，当我运行下面的代码时，赢得金额后没有任何显示: - 它完全是空白的。我什至尝试将
MYSQL:View 语句产生不正确的 SUM 总数
我有 3 个表。产品价格、开票产品和订购产品的表格。我正在尝试创建一个连接这些的 View 。我想输出产品价格以及开票产品总数和订购产品总数。产品价格 id season_id product
php - 在 while 循环中添加 mysql_num_rows 总数
例如，我在另一个查询的 while 循环内的查询中有一个 mysql_num_rows 结果为 4,8,15,16,23,42。我的问题是如何计算 while 循环中的所有结果？ (共 133 个)谢

首页

博学

6Ren·AI

商城

r - 在R中的数据集中以相等的间隔计算总数的百分比