- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 解决将 xls 数据导入 R 的问题阅读 xl 包裹。具体的 xls 文件有 18 列和 472 行,前 7 行有需要跳过的描述性文本。我只想选择列 1,3,6:9 在 EDA 的 18 列中。它们具有混合类型,包括日期、数字和文本。
readxl 似乎无法直接导入非连续列。我的计划是先使用 skip =7 阅读整张纸,然后使用 select next step。但是,问题是readxl默认将日期类型猜测为数字。在 readxl 中有没有办法指定 col_types 按列名 ?
带有示例 xlsx 的可重现代码,用于解决演示。
library(readxl)
xlsx_example <- readxl_example("datasets.xlsx")
# read the entire table
read_excel(xlsx_example)
# select specific column to name - following code does not work
read_excel(xlsx_example, col_types=col (Sepal.Length = "numeric"))
最佳答案
据我所知,您是 不是 能够指定col_types
按列名。不过,可以只读取特定列。例如,read_excel(xlsx_example, col_types=c("numeric", "skip", "numeric", "numeric", "skip"))
将导入第 1、3 和 4 列并跳过第 2 和 5 列。您可以为 18 列执行此操作,但我认为这有点难以跟踪将哪个列作为哪种类型导入。
另一种方法是使用 col_types = "text"
将所有列作为文本读取。然后按名称选择和转换变量。例如:
library(tidyverse)
library(readxl)
xlsx_example <- readxl_example("datasets.xlsx")
df <- read_excel(xlsx_example, col_types = "text")
df %>%
select(Sepal.Length, Petal.Length) %>%
mutate(Sepal.Length = as.numeric(Sepal.Length))
#> # A tibble: 150 x 2
#> Sepal.Length Petal.Length
#> <dbl> <chr>
#> 1 5.1 1.4
#> 2 4.9 1.4
#> 3 4.7 1.3
#> 4 4.6 1.5
#> 5 5.0 1.4
#> 6 5.4 1.7
#> 7 4.6 1.4
#> 8 5.0 1.5
#> 9 4.4 1.4
#> 10 4.9 1.5
#> # ... with 140 more rows
关于r - 如何使用 readxl 选择特定列和类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46508029/
Read_excel() 函数自动跳过前导空行。有没有办法避免这种情况,因为我需要 R 中的 row.names 与 excel 中的行号相对应? 当我不知道 read_excel 跳过了多少前导行时
我正在尝试使用 解决将 xls 数据导入 R 的问题阅读 xl 包裹。具体的 xls 文件有 18 列和 472 行,前 7 行有需要跳过的描述性文本。我只想选择列 1,3,6:9 在 EDA 的 1
如何简洁地导入选定的工作表,最好使用 readxl ,来自 .xlsx 工作簿? 使用下面的代码(方法 # 1),我可以在单个 .xlsx 工作簿中导入所有工作表,但是我如何filter()或 sel
当我使用readxl软件包键入以下行时: bluedata <-read_excel(“data.xlsx”,咖啡) 我收到以下错误: standardise_sheet(工作表,范围,sheets_
我收到了一个 Excel 电子表格:列名称位于第一行,垃圾文本位于第二行,实际数据从第三行开始。我想使用 readxl 包将其读入数据帧,保留第一行中的列名称,但丢弃第二行。 简单地将所有行读入数据帧
我正在尝试将一个 excel 文件读入 R。我需要从第 5 行开始读取 A 列和 C 列(没有 B)。这是我所做的: library(readxl) read_excel('./data/temp.x
我有一个充满 .xlsx 文件的目录。他们都有多张纸。我想从所有文件中提取同一张表并将它们附加到小标题中。 我找到了许多从单个 Excel 文件中提取多个工作表的解决方案;但是,不是多个文件中的一张纸
在阅读器中,read_csv命令通过重命名第二个重复项来处理重复的列名,并保持第一个不变。请参阅以下示例,取自 https://github.com/tidyverse/readxl/issues/5
考虑互联网上的一个文件(比如这个(注意 https 中的 s)https://evs.nci.nih.gov/ftp1/CDISC/SDTM/SDTM%20Terminology.xls 如何将文件的
我的应用程序正在阅读 xls和 xlsx使用 read_excel 的文件readxl 的功能包裹。 在阅读 xls 时,之前不知道列的顺序和确切数量。或 xlsx文件。有 15 个预定义列 其中 1
我正在尝试使用“readxl”包函数“read_excel”在 R 中打开 Excel 工作表。 library(readxl) Test <- read_excel("Test.xlsx",shee
我在使用 readxl 包中的 read_excel 函数将 xls 文件读入 R 时遇到了一些问题。数据框已生成,但至少缺少一列,我多次打印以下消息: fread: wanted 1 got 0 l
我有多个 .xls (~100MB) 文件,我想将多个工作表(从每个工作表)作为数据框加载到 R 中。我试过各种功能,如xlsx::xlsx2和 XLConnect::readWorksheetFro
我对 R 和一般编程非常陌生,需要帮助排列 ~2000 个 .xls 和 .xlsx 文件中包含的数据。每个文件以标题前的 34 - 40 行“垃圾”文本开头;标题下的所有数据都具有相同的维度。 我尝
我想读取网站 Link 中 Excel 文件的第 1 张数据。使用 Excel 文件的 url。我使用的是 Windows 10 R 3.6.1。 我正在尝试使用 Read Excel file fr
我是一名优秀的程序员,十分优秀!