R:因子水平，将其余重新编码为 'other'-6ren

R:因子水平，将其余重新编码为 'other'

转载作者：行者123 更新时间：2023-12-04 02:02:29

24

4

我很少使用因子，通常认为它们易于理解，但我经常对特定操作的细节感到模糊。目前，我正在编码/折叠类别，几乎没有观察到“其他”，并且正在寻找一种快速的方法来做到这一点 - 我有一个可能有 20 个级别的变量，但我有兴趣将其中的一堆折叠为一个。

data <- data.frame(employees = sample.int(1000,500),
                   naics = sample(c('621111','621112','621210','621310','621320','621330','621340','621391','621399','621410','621420','621491','621492','621493','621498','621511','621512','621610','621910','621991','621999'),
                                  100, replace=T))

这是我的兴趣水平，以及它们在不同向量中的标签。

#levels and labels
top8 <-c('621111','621210','621399','621610','621330',
         '621310','621511','621420','621320')
top8_desc <- c('Offices of physicians',
               'Offices of dentists',
               'Offices of all other miscellaneous health practitioners',
               'Home health care services',
               'Offices of Mental Health Practitioners',
               'Offices of chiropractors',
               'Medical Laboratories',
               'Outpatient Mental Health and Substance Abuse Centers',
               'Offices of optometrists')

我可以使用 factor()调用，将它们全部列举出来，每当一个类别几乎没有观察到时，就将它们归类为“其他”。

假设 top8和 top8_desc以上是实际的前8名，最好的申报方式是什么 data$naics作为因子变量，使得 top8 中的值正确编码，其他所有内容都重新编码为 other ?

最佳答案

我认为最简单的方法是将所有不在前 8 名中的 naics 重新标记为特殊值。

data$naics[!(data$naics %in% top8)] = -99

然后你可以在把它变成一个因素时使用“排除”选项

factor(data$naics, exclude=-99)

关于R:因子水平，将其余重新编码为 'other'，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15533594/

24

4

0

文章推荐： java - Cognito 通过用户名获取用户

文章推荐： sql - T-SQL 根据列删除重复项

文章推荐： random - random() 似乎不会绘制范围极值

haskell - 水平、垂直和对角线上的数字相乘
我目前正在研究一个项目欧拉问题(www.projecteuler.net)，但遇到了一个绊脚石。其中一个问题提供了一个 20x20 的数字网格，并要求直线上 4 个数字的最大乘积。这条线可以是水平的、
join - 水平 UNION ALL
我有两个表，我需要从每个表中选择一列。这必须在单个查询中完成。好消息是这两列以正确的方式排序，并且它们都包含相同数量的行。现在，我知道我可以通过 rowid 加入两个表，但它很慢，因为它必须进行
iphone - 水平 UITableView
我想在我的 iPad 应用程序中实现一个布局，该布局具有一个可左右滚动而不是上下滚动的合适 View : 所以而不是第 1 行第 2 行第 3 行(垂直滚动)这将是 :第 1 行、第 2 行、第 3
imagemagick - 并排合并图像(水平)
我有五个尺寸的图像:600x30、600x30、600x30、600x30、810x30。它们的名称分别是:0.png、1.png、2.png、3.png、4.png。如何使用 ImageMagic
java - 滚动浏览多个列表(水平)
我正在寻找一个选项来滚动多个列表(水平)，如附件中的图片所示。您可以向左或向右滑动以进入下一个 ListView 。顶部应该有一些按钮可以单击或滚动我尝试将 ListViews 放入类似此代码的内容
camera - 水平、垂直和对角线视野之间的关系
这些值之间是否存在数学关系？如果我知道 hFOV 和 vFOV，我可以计算对角 FOV 而不涉及焦距等其他值吗？我的第一个想法是使用毕达哥拉斯定理，但也许这是错误的。最佳答案感兴趣的物理量是传感
c++ - 水平/垂直均匀分布网格单元？
我正在尝试在 game_width=640 和 game_height=480 的窗口内绘制网格。网格单元的数量是预定义的。我想在水平和垂直方向上均匀分布单元格。 void GamePaint(HDC
水平 ScrollView 上的android绘图线
你好，我已经发布了我的 iphone 应用程序 Micro-Pitch，现在正在将它移植到 android 上。我不知道如何在 ScrollView 中画线，想知道我做错了什么。这是我的 Scrol
css - 对齐图像 - 水平
如果您访问我的网站:www.ryancoughlin.com - 如果您在页面右侧看到 Google、Yahoo 等 RSS 按钮。我试图让它们均匀对齐，它们的图像高度都相同，我一直试图让它们均匀对齐
javascript - 居中问题(水平)
我想将此 Material 水平居中: 最佳答案将 text-align:center 添加到您的 anchor 。我假设您的 zoom1 具有 display
html - 旋转木马共享行 - 水平
我正在努力做到这一点，以便我的旋转木马可以与其他文本共享一个水平行，但由于某种原因它无法正常工作，当它设置为 40% 时它占据了 100% 的宽度。我将在下面发布代码和屏幕截图。在上图中，它显示了
html - 如何将元素的宽度设置为从特定位置到页面末尾(水平)
问题来了。我正在尝试放置一些彼此相邻的元素。 div 的宽度s 未指定，取决于它们的内容。我正在使用下面的 CSS 代码来定位彼此相邻: #div{ height: 50px; f
css - 无法并排打印表格(水平)
我正在尝试使用这样的 Bootstrap 并排打印表格但是当我尝试打印预览时，我得到了这个我的代码如下。我尝试了所有可能的解决方案，但我不知道为什么我无法打印我看到的页面。请指导我解决这个问题。
html - 两种背景颜色(水平)
我想知道是否可以在背景中使用两种不同的颜色，并通过 Bootstrap 在每一侧扩展 100%。这是我的意思的截图，左侧为红色，右侧为深色，为更大的屏幕放大 100%。有什么简单的解决方案吗？最
javascript - jquery滚动垂直/水平
我正在尝试制作一个包含所有事件的滚动触发的整个网站。我只需要帮助来实现这种效果: 我有一个网站，其中包含一些填满所有视口(viewport)的 div，我希望用户能够向下滚动到一个命名的 div，然后
html - 按钮之间的间距相等(水平)
我的代码是 Show All Show Valid Show Pending Save Clear Download As CSV 我希望那些输入日期和按钮在 class="buttons" di
javascript - 可扩展的菜单框(水平)
我在玩这个想法: 在这个 block 中我有 2 作为按钮和并尝试了 float荷兰国际集团他们让他们粘在一起。实现这种效果的主要思想是操纵 ul 的宽度/显示状态。或者只是菜单部分。 Log
html - 如何将此幻灯片移动到页面的中心(水平)？
这个问题在这里已经有了答案: How can I horizontally center an element? (134 个回答) 关闭 4 年前。
jquery - 水平/垂直跨浏览器居中图像
我遇到了一个 CSS 问题，需要帮助。我在目录中有许多不同大小的图像，我正在动态列出它们以显示以下 View :(我仅显示两个图像作为示例) 这是我的 HTML:
android - 水平 ListView
这个问题在这里已经有了答案: 关闭 9 年前。 Possible Duplicate: How can I make a horizontal ListView in Android? 我已经多次使

首页

博学

6Ren·AI

商城

R:因子水平，将其余重新编码为 'other'