gpt4 book ai didi

regex - 如何在 R 中将文本文件读取为一行

转载 作者:行者123 更新时间:2023-12-02 19:35:06 25 4
gpt4 key购买 nike

我正在尝试处理一个文本文件。总的来说,我有一个想要分析的语料库。为了使用 tm 包(R 中的文本挖掘包)创建一个语料库对象,我需要使该段落成为一个巨大的向量,以便能够正确阅读。

我有一个段落

          Commercial exploitation over the past two hundred years drove                  
the great Mysticete whales to near extinction. Variation in
the sizes of populations prior to exploitation, minimal
population size during exploitation and current population
sizes permit analyses of the effects of differing levels of
exploitation on species with different biogeographical
distributions and life-history characteristics.

我使用了 scan 和 readLine 方法,它像这样处理文本:

[28]“过去两百年的商业开发插入了”
[29]《大须鲸走向濒临灭绝的变异》
[30]“开发前人口规模最小”

有没有办法去掉换行符?或者将文本文件作为一个巨大的向量读取?

到目前为止发布的所有解决方案都非常好,谢谢。

最佳答案

这会将整个文件读入长度为一的字符向量。

x <- readChar(file, file.info(file)$size)

关于regex - 如何在 R 中将文本文件读取为一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27339142/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com