r - dplyr : how to read a tsv file with headers while skipping some lines?-6ren

r - dplyr : how to read a tsv file with headers while skipping some lines?

转载作者：行者123 更新时间：2023-12-03 09:12:44

25

4

我有一个简单的tsv文件结构如下:

0 - headerline
1 - empty line
2 - PIG schema
3 - empty line
4 - 1-st line of DATA
5 - 2-nd line of DATA

我想阅读它，可能使用 readr::read_tsv但这是问题所在。

如您所见，第一行包含标题。然后我有三行我不想想要读取它(它们包含一些来自 Apache PIG 的 super 奇怪的数据)，并且数据从第 4 行开始。在 Pandas ，我会做类似的事情

df = pd.read_csv('/localpath/data.tsv', sep='\t', skiprows=[1,2,3])

它允许我阅读标题和以跳过第一行、第二行、第三行。

我在 readr::read_tsv 中没有看到类似的选项。那就是:

df = read_tsv('/localpath/data.tsv', col_names = TRUE, skip = 4)

它不解析 header ...

有什么想法吗？

最佳答案

发布我的评论作为答案。基本上，我们读取第一行作为标题，然后读取其余行作为数据:

library(readr)
names_t <- read_tsv('/localpath/data.tsv', col_names = FALSE, n_max = 1)
df1 <- read_tsv('/localpath/data.tsv', col_names = FALSE, skip = 4)
names(df1) <- names_t

请注意，在我的评论中，我指定了 nrows = 1 来读取名称(这适用于 read.csv)，但似乎该参数已被替换通过 readr::read_tsv 中的 n_max。

关于r - dplyr : how to read a tsv file with headers while skipping some lines?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40656827/

25

4

0

文章推荐： java - 如何在 Spring 中的 @Async 方法中使用当前语言环境

文章推荐： javascript - 如何通过jquery ajax提交checkbox？

文章推荐： symfony - 在 IntelliJ IDEA 中显示嵌套用法

word2vec - skip-gram 和 skip-n-gram 的预训练向量
我正在做一个项目，我需要一个 skip-gram 模型的预训练向量。我听说还有一个名为 skip-n-gram 模型的变体可以提供更好的结果。我想知道自己训练模型需要什么？因为我只需要它们来为我的模
c# - System.Linq.IOrderedQueryable' 在尝试使用 Skip 方法时不包含 'Skip' 错误的定义
我正在尝试实现 EF 提供的分页功能。我以为我只需要将简单的 Skip() 和 Take() 添加到我的查询中，但后来我收到了这条消息: Error 4 'System.Linq.IOrderedQu
c++ - Boost Spirit Qi Re-Establish skipping with custom skip 语法
到目前为止，我有一个语法一直在使用标准的 boost::spirit::ascii::space/boost::spirit::ascii::space_type 船长。我有一些使用船长的规则和一些
exception - 仅 LINQ to Entities 中的排序输入支持方法 'Skip'。方法 'OrderBy' 必须在方法 'Skip' 之前调用
我正在处理动态数据。创建动态模型并在global.asax中注册后，如 DefaultModel.RegisterContext(typeof(masterEntities1),new Contex
c# - 方法 ‘Skip’ 仅支持 LINQ to Entities 中的排序输入。必须在方法 ‘OrderBy’ 之前调用方法 ‘Skip’
在 Visual Studio 2013 Update 1 中使用 Entity Framework 6.0.2 和 .NET 4.5.1 DbContext连接到 SQL Server: 我有一个很
asp.net - 将动态数据添加到现有站点时出错 - 'Skip' 仅支持 LINQ to Entities 中的排序输入。 'OrderBy' 必须在 'Skip' 之前调用
我正在创建一个支持动态数据的 ASP.NET 网站。当我从头开始(从 VS 中的模板)创建动态网站时，一切正常。但是，当我尝试添加动态实体 (.edmx) 文件并运行应用程序时，出现以下错误: “Sk
actionscript-3 - AS3 : Can we skip an optional parameter and assign value to the parameter after the skipped one?
我们可以跳过一个可选参数并为跳过的参数赋值吗？例如我有一个函数: public function Dialog(message:String,title:String="Note",dialogsi
ios - QuerySnapshot 在 Firestore 中运行时出错 - 抛出错误 Skipping epollex because skipping EPOLLEX GRPC_LINUX_EPOLL is not defined
我创建了一个函数来从我的 firestore 集合中提取一个随机文档，然后返回一个 FIRQuery。得到它后，我创建了一个模型文件来解析我的 firestore 文档中的任何 FIRQuery 数据
c++ - 如何修复 "initialization of ' hwndButton' is skipped by 'case' label"and hwndButton' is skipped by 'default' label"
我对编程比较陌生，我想尝试看看如何在 Visual Studio 2019 中制作基本的 Windows 桌面应用程序。由于我为按钮添加了代码，所以 C2360 和 C2361 错误不断弹出，但我没有
Clickhouse:如何在 clickhouse 中使用 `Data Skipping Indexes` 和 `Manipulations With Data Skipping Indices` 功能？
我正在使用 Data Skipping Indexes clickhouse 中的功能，我对它的用法感到困惑。如果我在创建表时添加数据跳过索引，如下所示: CREATE TABLE MyTable (
maven - “-Dmaven.test.skip.exec”与 “-Dmaven.test.skip=true”和 “-DskipTests”有什么区别？
我不确定Maven指令-Dmaven.test.skip.exec和-Dmaven.test.skip=true -DskipTests之间的区别是什么。两者似乎都抑制了测试周期。最佳答案 “mav
c# - 当 skip 不能被 take 整除时，通过 pageIndex/pageSize 分页实现 skip/take 分页
假设我有一些神奇的分页黑盒类，它使用 pageIndex 和 pageSize 检索数据，如下所示: public class PaginatedList { // ... // Ch
ruby-on-rails - --skip-sprockets 和 --skip-javascript 仍然生成 app/assets/javascripts/application.js 吗？
我计划使用 Bowerjs 来管理前端依赖项，并使用 gulp.js 来连接、缩小和编译前端代码。因此，我想跳过 Rails Assets 管道，包括 sprocket。我运行以下命令来跳过 Asse
ruby-on-rails - --skip-sprockets 和 --skip-javascript 仍然生成 app/assets/javascripts/application.js 吗？
我计划使用 Bowerjs 来管理前端依赖项，并使用 gulp.js 来连接、缩小和编译前端代码。因此，我想跳过 Rails Assets 管道，包括 sprocket。我运行以下命令来跳过 Asse
c# - 分页错误 :The method 'Skip' is only supported for sorted input in LINQ to Entities. 方法 'OrderBy' 必须在方法 'Skip' 之前调用
我正在索引页上的 MVC 中进行分页......在这一行我得到了错误 return View( employee.ToPagedList(Page ?? 1,3)); 这里是索引方法 public
python - Skip Connections的科学解释
我正在搜索关于跳过连接的科学工作。每个人都在谈论通过网络改进梯度流，这感觉很有意义。但是我很想理解和阅读归根结底的数学和代码意味着什么以及如何在 tensorflow 中深入实现它。 resnet
antlr - "skip"更改解析器行为
添加 skip规则不符合我的期望。这是由逗号和空格分隔的一对标记的语法。我制作了一个版本，其中逗号标记为 skip ，还有一个不是: grammar Commas; COMMA: '
jupyter笔记本幻灯片: Skip as default
将Jupyter用于幻灯片时，是否有默认方法将幻灯片类型设置为跳过新单元格的？最佳答案我针对您所要求的解决方法。创建一个空的“跳过”幻灯片并键入: 退出 C 伏特伏特伏特复制并粘贴许多空的
SVN更新: 'skipped' message
我正在尝试使用更新 svn update --username myusername https://my.svn.address 但是，我只是收到一条“已跳过”消息？最佳答案我猜你遇到了这种类型
Flash时间线脚本: will they be skipped?
Flash 的 MovieClip 时间轴的创建方式可以跳过帧以保持动画平滑度和音频同步。我的问题是，如果帧上有 ActionScript，是否有可能跳过该帧，从而不调用脚本？或者有脚本的帧永远不

首页

博学

6Ren·AI

商城

r - dplyr : how to read a tsv file with headers while skipping some lines?