作者热门文章
- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我目前正在使用一些文件来使用 Scala 应用程序进行解析。问题是文件太大,所以它们最终总是在堆大小中抛出异常(我已经尝试了最大堆大小,但仍然没有用)。
现在,文件看起来像这样:
This is
one paragraph
for Scala
to parse
This is
another paragraph
for Scala
to parse
Yet another
paragraph
等等。基本上我想把所有这些文件分成 10 或 20 个,但我必须确保结果中的段落没有分成两半。有什么办法吗?
谢谢!
最佳答案
csplit file.txt/^$/{*}
csplit
以指定模式分割文件。
/^$/
匹配空行。
{*}
无限重复之前的模式。
关于linux - Bash:将 linux 中的文件拆分为 10 个仅由空行组成的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22674245/
我是一名优秀的程序员,十分优秀!