r - 如何使用 R 中的范围数据显示离散类别中的频率？-6ren

r - 如何使用 R 中的范围数据显示离散类别中的频率？

转载作者：行者123 更新时间：2023-12-04 20:05:17

25

4

我正在整理我掌握的关于恐龙及其年龄范围的大量数据。到目前为止，我的数据由一列名称组成，然后是两列过去数百万年的最大和最小日期，您可以在此处看到:

GENUS           ma_max  ma_min  ma_mid    
Abydosaurus     109     94.3    101.65    
Achelousaurus   84.9    70.6    77.75    
Acheroraptor    70.6    66.043  68.3215

地质时间分为不同的时代(如侏罗纪和白垩纪)，这些时代又分割为阶段。这些阶段有特定的年龄范围，我制作了一个数据框来显示这些:

Stage          ma_max ma_min ma_mid
Hettangian      201.6  197.0 199.30
Sinemurian      197.0  190.0 193.50
Pliensbachian   190.0  183.0 186.50
Toarcian        183.0  176.0 179.50
Aalenian        176.0  172.0 174.00
Bajocian        172.0  168.0 170.00
Bathonian       168.0  165.0 166.50
Callovian       165.0  161.0 163.00
Oxfordian       161.0  156.0 158.50
Kimmeridgian    156.0  151.0 153.50
Tithonian       151.0  145.5 148.25
Berriasian      145.5  140.0 142.75
Valanginian     140.0  136.0 138.00
Hauterivian     136.0  130.0 133.00
Barremian       130.0  125.0 127.50
Aptian          125.0  112.0 118.50
Albian          112.0   99.6 105.80
Cenomanian      99.6   93.5  96.55
Turonian        93.5   89.3  91.40
Coniacian       89.3   85.8  87.55
Santonian       85.8   83.5  84.65
Campanian       83.5   70.6  77.05
Maastrichtian   70.6   66.5  68.05

我试图找出每个阶段有多少个属。问题是范围 - 例如，一个属可以有一个跨越 3 个或更多阶段的范围，我希望每个阶段都记录一个属的存在。有什么简单的方法可以做到这一点吗？我考虑过使用 lattice 包中的“shingle”，正如在此处类似讨论中所建议的那样，但我对 R 很陌生，不确定它是否可以以数据有范围的方式实现。

最佳答案

我会推荐 sqldf包。

library(sqldf)

假设您的 GENUS 数据位于 genus 数据框中，而 Stage 位于 stage 数据框中。

res <- sqldf("select count(*) as countDinos , s.Stage, GROUP_CONCAT(g.GENUS) as names from genus g,stage s where (g.ma_max>=s.ma_min AND g.ma_max<=s.ma_max)  OR  (g.ma_min>=s.ma_min AND g.ma_min<=s.ma_max) OR (g.ma_max>s.ma_max AND g.ma_min<s.ma_min)   group by s.Stage order by s.ma_mid DESC  ")

应该给你这样的回应:

countDinos  Stage         names
   1        Albian                         Abydosaurus   
   1        Cenomanian                     Abydosaurus   
   1        Santonian                      Achelousaurus 
   2        Campanian       Achelousaurus ,Acheroraptor  
   2        Maastrichtian   Achelousaurus ,Acheroraptor

关于r - 如何使用 R 中的范围数据显示离散类别中的频率？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26950123/

25

4

0

文章推荐： java - 逐行分析 Java

文章推荐： arrays - Haskell:List v. Array，性能差异

文章推荐： tfs - 在 MSBuild 中包含项目之外的文件

dart - 如何使 slider 离散？
如何在 Flutter 中使 slider 离散看起来像上图？ slider discrete 最佳答案使用 divisions Slider 的属性(property)小部件将其分成相等的部分，然
python - 离散 pyplot 散点颜色条
我正在创建一个带有颜色条的散点图 plt.scatter(X, Y, c=Z) plt.colorbar() plt.show() plt.close() 其中 X 和 Y 是 float 组，Z 是
Android seekbar 离散，如何删除步骤指示器
我刚刚在 android studio 中发现了 seekbar 离散小部件，我发现它非常有用，但我不知道如何删除步骤指示器，或者用更合适的可绘制对象更改它们。有人设法做到了吗？这是我当前搜索栏的
c - 是否可以在没有 for 循环的情况下执行“离散”几何和？
问题请注意以下问题:巫师可以创建和销毁 rune 。创建一个新的 rune 需要消耗与先前创建的 rune 数量成比例的法力。摧毁 rune 会恢复创建 rune 所用的法力。下面，我提出一个可能的
r - 多重 geom_sf 色彩美学(离散+连续)
我正在尝试使用 ggplot2 中的 sf 和 geom_sf 制作 map ，其中一组点数据使用连续颜色比例(-1 到 1)，一组线数据使用离散比例(a、b、c、d)着色。但是，当我在同一张 map
machine-learning - 针对连续状态、离散 Action 的强化学习算法
我正在尝试在具有连续状态(dim.= 20)和离散操作(3 个可能的操作)的环境中找到最佳策略。并且有一个特定的时刻:对于最佳策略，一个操作(称为“操作 0”)的选择频率应比其他两个操作高得多(频率约
algorithm - "Drawing"离散 x-y 步长的弧
仅使用 x-y 位置移动绘制圆弧的最佳方法是什么？例如，假设我想在点 (4,4) 处绘制一个半径为 4 的圆。让我们看看我的“抽屉”从 (4,0) 开始，每个方向的分辨率为 0.1 步。我将如何创建一
r - 使用离散化(离散=T)时无法在 mgcv 中生成预测
我正在使用一个使用广义加法模型的随机站点级效应来拟合一个模型，该模型在 mgcv 中实现。 R 包。我一直在使用函数 gam() 执行此操作但是，为了加快速度，我需要转到 bam()框架，与gam()
r - 将段添加到 ggplot2 中的条形图(离散 x 轴)
这个问题在这里已经有了答案: Make a line separated by group in bar chart (3 个答案) 关闭上个月。我正在尝试使用 ggplot2 在条形图的每个条上
r - 将段添加到 ggplot2 中的条形图(离散 x 轴)
这个问题在这里已经有了答案: Make a line separated by group in bar chart (3 个答案) 关闭上个月。我正在尝试使用 ggplot2 在条形图的每个条上
cuda - 在 opencl 中 CPU 作为主机，intel HD 4000 作为设备 1，离散 GPU 作为设备 2
是否可以同时使用 Intel HD 4000 集成显卡和独立 GPU，OpenCL(或 CUDA)作为设备，CPU 作为主机？我想要一些代码在集成显卡上运行，而其他代码同时在我的 GPU 上运行。最

首页

博学

6Ren·AI

商城

r - 如何使用 R 中的范围数据显示离散类别中的频率？