- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试将一系列句子拆分为单独的单词,即对文本进行标记。
我找到了一个 R 包 splitstackshape
这能够做我想做的事,几乎......它将输出截断到前5行和最后5行。
无论如何,这就是我需要做的:
id text
1 Lorem ipsum dolor sit amet
2 consectetur adipiscing elit
3 Donec euismod enim quis
4 nunc fringilla sodales
5 Etiam tempor ligula vitae
6 pellentesque dictum
7 Quisque non justo scelerisque
8 est facilisis congue quis vel
9 Phasellus ex lorem
10 eleifend at magna vel
11 egestas eleifend massa
输出:
id word
1 Lorem
1 ipsum
1 dolor
1 sit
1 amet
2 consectetur
2 adipiscing
...
也就是说,我需要在单独的行中使用单词,但要与它所属的句子的 ID 一起显示。
cSplit(data, "text", " ", "long")
,但它截断了..
最佳答案
cSplit
函数返回 data.table
.
您所描述的是 data.table
的默认打印行为s。要查看此操作,请尝试以下操作:
library(data.table)
as.data.table(airquality)
print(as.data.table(airquality))
print(as.data.table(airquality), nrows = Inf)
library(splitstackshape)
print(cSplit(data, "text", " ", "long"), nrows = Inf)
关于r - 使用 R 和 cSplit() 将文本拆分为单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32624120/
我有一个包含两列的长列表,其中多行中的每列都有相同的字符串。因此,我使用 paste 使用 - 连接,然后使用 setDT 返回唯一的一组连接及其频率。 现在我想反转我的串联。 我尝试过: libra
我有一个大文本文件,其内容设置如下: --- title: Lorim Ipsum Dolar --- Lorim ipsum content --- title: Excelvier whateve
有一个非常大的纯文本文件,大约有 4000 万行,每行具有相同的长度和格式,我们想使用 csplit 将它逐行拆分为 N 个文件。比如N为80,那么生成的文件名应该是: FILE00000001.tx
我正在尝试运行读取 CSV 的复杂导入任务。此导入工作正常,除非服务器用完可用内存来完成任务。我试图将文件分成 1000 行的 block ,以允许服务器然后一个接一个地处理这些“一口大小”的部分。然
我有一个如下所示的日志文件: Jan 01 This the log of this day. Jan 01 This the log of this day. Jan 01 This the
我有一个巨大的 (4GB) XML 文件,我目前正在使用 linux“拆分”功能将其分成 block (每 25,000 行 - 不是按字节)。这通常效果很好(我最终得到大约 50 个文件),除了一些
我正在寻找一种通过分隔符拆分列内容并将表格转换为长格式的方法。我找到了 cSplit来自 splitstackshape包,它几乎正在做我正在寻找的东西。 现在的问题是 drop选项。我希望我的拆分列
我正在尝试将一系列句子拆分为单独的单词,即对文本进行标记。 我找到了一个 R 包 splitstackshape这能够做我想做的事,几乎......它将输出截断到前5行和最后5行。 无论如何,这就是我
我在 Linux 终端上努力将一个大文本文件拆分成几个较小的文件。我尝试使用 csplit,但 csplit 要求分隔符模式作为 REGEXP 传递。静态定界符模式是 , lorum ipsum。我如
这应该是一个简单的任务......! 我有一个包含许多 html 文件的目录。每个都有一个 div 调用一个名为 crumb 的类。我想在 crumb 上将文件分成两部分。稍后,我会将拆分文件的第二部
(我使用的是 Mac OS X,这个问题可能特定于该 Unix 变体) 我正在尝试使用 csplit 拆分文件用正则表达式。它由合并成一个长文本文件的各种文章组成。每篇文章都以“保留所有权利”结尾。这
我是一名优秀的程序员,十分优秀!