- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用以下命令从文件中提取域名和完整域扩展名。例如:www.abc.yahoo.com、www.efg.yahoo.com.us。
[a-z0-9\-]+\.com(\.[a-z]{2})?' source.txt | sort | uniq | sed -e 's/www.//'
> dest.txt
当我在 source.txt
之后指定较小的最大参数 -m 100
时,命令写入正确。如果我没有指定,或者如果我指定了一个巨大的数字,就会出现问题。虽然,我之前可以使用 grep(不是 egrep)写入文件,其中的数字与我现在正在尝试的类似,而且是成功的。我还在执行命令期间检查了最后修改的日期和时间,目标文件中似乎没有发生任何修改。可能是什么问题?
最佳答案
正如我在您的 earlier question 中提到的,这可能不是 egrep
的问题,但是您的文件太大并且 sort
不会输出任何内容(到 uniq
)直到egrep 完成了。我建议您使用 split 将文件分成可管理的夹头命令。像这样:
split -l 10000000 source.txt split_source.
这会将 source.txt
文件分成 1000 万行 block ,分别称为 split_source.a
、split_source.b
、split_source .c
等。您可以对这些文件中的每一个运行整个命令(并且可能更改管道以在末尾附加:>> dest.txt
)。
这里的问题是你可以在多个文件中得到重复项,所以最后你可能需要运行
sort dest.txt | uniq > dest_uniq.txt
关于linux - egrep 不写入文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11714612/
我想使用 find 来查找以小写字母开头的目录中的每个文件。 一个简单的正则表达式结合 find 应该可以解决这个问题(我不需要处理文件名中的空格)。 所以我尝试了find . -regextype
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题?通过 editing this post 添加详细信息并澄清问题. 1年前关闭。 Improve this
如果您的文件包含 apples are good apple cider is also good 为什么会egrep '(?=apples)app' file无法接听任何线路? 在 MAC 上使用
我正在尝试运行此命令来进行一些清理。 egrep -v -f ref_file.css my_file.css 但是,它给了我一个错误。 egrep: 不匹配 ( 或\( 我该如何解决这个问题?我使用
如何使用正则表达式找到至少包含两次相同单词的行? 我试过: egrep '\w{2,}\1' file 但是终端给我错误: egrep: invalid backreference number 最
我在多个主机上有多个 Apache vHost 配置。我正在尝试编写一个 Bash 脚本,它将遍历每个主机并搜索 .conf每个文件,拉出第一个(只有第一个)堵塞。我试过写一个正则表达式来匹配它,但它
我想用正则表达式获取函数调用的参数(不带括号)。 我在 cygwin 的 bash 脚本中使用 egrep。 这是我到目前为止得到的(带括号): $ echo "require(catch.me)"
这个问题在这里已经有了答案: Check if all of multiple strings or regexes exist in a file (21 个回答) 关闭 4 年前。 我知道 eg
我正在使用以下命令从文件中提取域名和完整域扩展名。例如:www.abc.yahoo.com、www.efg.yahoo.com.us。 [a-z0-9\-]+\.com(\.[a-z]{2})?' s
我有一个文件,内容如下: [TEXT_ID=2] [TEXT_REV=3] [NO_OF_BYTES=16] 0010002$%!003000040000000010100 [TXT] FF FF [
我写了一个小脚本,它将egrep服务器日志中的两个模式 pattern - 'Unable to resolve location classpath:db/migration|Processing
$ cat file c f t e, u y r s p I y p A w p d. R i G e w o a l n o v s. P G e a o c f s p k e i c w a
这个问题在这里已经有了答案: Fastest possible grep (12 个答案) 关闭 8 年前。 我需要从一个包含 200 万行的大型 csv 文件中进行 egrep,我想将 egrep
我必须从一个类似这样的文件名 temp 中进行 grep Process State BE_RP:1 [PL_2_3] Running BE_RP:2 [PL_2_4
我试图清除只包含一次“Hihihihihihihi!”以及任意多个“hi”的行 这是我写的 egrep "^Hi(hi)*!$" myfile.txt 但是没有用。按enter后,命令再次显示: e
我在使用 egrep 时遇到问题,它似乎忽略了特殊字符,例如 !@#%。 目标是删除超过 3 个完全相同字符的行。字符不需要一个接一个。 111!!!qqq! #should be removed b
我正在使用 egrep 查看我们 perforce NAS 中的脚本。 我正在尝试找到我们使用 RCP 和 RSH 的地方....我遇到的问题是 1) 我不擅长 REGEX; 2) 我正在捡起我不感兴
我想了解为什么使用 include 参数它不会搜索目标文件 Identification.php。 与 包括范围 : admin@server:/filer/www/website/httpdocs$
我有一百万多包含类似于下面的行的文本文件 abc,xyz, =12093| abc,xyz, =12093, =10998| 第一行没问题,但我想找到第二行的所有内容。即我想打印所有作为模式 , =
任何人都可以在这里帮忙。如果 egrep 不可行,其他建议也将受到高度赞赏。 我正在尝试使用“UTL_RECOMP_SLAVE_75”将 egrep 表达式写入 grep ORA-00942,当它位于
我是一名优秀的程序员,十分优秀!