linux - egrep 不写入文件-6ren

linux - egrep 不写入文件

转载作者：太空宇宙更新时间：2023-11-04 11:30:22

25

4

我正在使用以下命令从文件中提取域名和完整域扩展名。例如:www.abc.yahoo.com、www.efg.yahoo.com.us。

[a-z0-9\-]+\.com(\.[a-z]{2})?' source.txt | sort | uniq | sed -e 's/www.//' 
> dest.txt

当我在 source.txt 之后指定较小的最大参数 -m 100 时，命令写入正确。如果我没有指定，或者如果我指定了一个巨大的数字，就会出现问题。虽然，我之前可以使用 grep(不是 egrep)写入文件，其中的数字与我现在正在尝试的类似，而且是成功的。我还在执行命令期间检查了最后修改的日期和时间，目标文件中似乎没有发生任何修改。可能是什么问题？

最佳答案

正如我在您的 earlier question 中提到的，这可能不是 egrep 的问题，但是您的文件太大并且 sort 不会输出任何内容(到 uniq)直到egrep 完成了。我建议您使用 split 将文件分成可管理的夹头命令。像这样:

split -l 10000000 source.txt split_source.

这会将 source.txt 文件分成 1000 万行 block ，分别称为 split_source.a、split_source.b、split_source .c 等。您可以对这些文件中的每一个运行整个命令(并且可能更改管道以在末尾附加:>> dest.txt)。

这里的问题是你可以在多个文件中得到重复项，所以最后你可能需要运行

sort dest.txt | uniq > dest_uniq.txt

关于linux - egrep 不写入文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11714612/

25

4

0

文章推荐： c++ - QTransform::setRotation 与 Q_PROPERTY

文章推荐： java - 尝试使用状态代码验证来自 android json post 的登录

文章推荐： c++ - boost 原子类使初始化值不同于成员初始化列表

regex - 尽管使用 regextype egrep，为什么 GNU find 实用程序会在正则表达式上与 egrep 产生不同的匹配？
我想使用 find 来查找以小写字母开头的目录中的每个文件。一个简单的正则表达式结合 find 应该可以解决这个问题(我不需要处理文件名中的空格)。所以我尝试了find . -regextype
linux - egrep AND 多个模式的条件不起作用
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题？通过 editing this post 添加详细信息并澄清问题. 1年前关闭。 Improve this
regex - 使用正则表达式前瞻，egrep
如果您的文件包含 apples are good apple cider is also good 为什么会egrep '(?=apples)app' file无法接听任何线路？在 MAC 上使用
grep - egrep : Unmatched ( or\(
我正在尝试运行此命令来进行一些清理。 egrep -v -f ref_file.css my_file.css 但是，它给了我一个错误。 egrep: 不匹配 ( 或\( 我该如何解决这个问题？我使用
regex - egrep 找到至少有两次相同单词的行
如何使用正则表达式找到至少包含两次相同单词的行？我试过: egrep '\w{2,}\1' file 但是终端给我错误: egrep: invalid backreference number 最
regex - egrep 匹配多行
我在多个主机上有多个 Apache vHost 配置。我正在尝试编写一个 Bash 脚本，它将遍历每个主机并搜索 .conf每个文件，拉出第一个(只有第一个)堵塞。我试过写一个正则表达式来匹配它，但它
正则表达式以使用 egrep 获取分隔内容
我想用正则表达式获取函数调用的参数(不带括号)。我在 cygwin 的 bash 脚本中使用 egrep。这是我到目前为止得到的(带括号): $ echo "require(catch.me)"
bash - egrep AND 运算符
这个问题在这里已经有了答案: Check if all of multiple strings or regexes exist in a file (21 个回答) 关闭 4 年前。我知道 eg
linux - egrep 不写入文件
我正在使用以下命令从文件中提取域名和完整域扩展名。例如:www.abc.yahoo.com、www.efg.yahoo.com.us。 [a-z0-9\-]+\.com(\.[a-z]{2})?' s
regex - egrep 正则表达式操作未按预期工作
我有一个文件，内容如下: [TEXT_ID=2] [TEXT_REV=3] [NO_OF_BYTES=16] 0010002$%!003000040000000010100 [TXT] FF FF [
linux - egrep 没有得到结果
我写了一个小脚本，它将egrep服务器日志中的两个模式 pattern - 'Unable to resolve location classpath:db/migration|Processing
regex - egrep 该行以
$ cat file c f t e, u y r s p I y p A w p d. R i G e w o a l n o v s. P G e a o c f s p k e i c w a
linux - 什么是最快的 egrep
这个问题在这里已经有了答案: Fastest possible grep (12 个答案) 关闭 8 年前。我需要从一个包含 200 万行的大型 csv 文件中进行 egrep，我想将 egrep
regex - egrep 字符串大小写
我必须从一个类似这样的文件名 temp 中进行 grep Process State BE_RP:1 [PL_2_3] Running BE_RP:2 [PL_2_4
linux - Egrep 结果是当前命令和垃圾
我试图清除只包含一次“Hihihihihihihi!”以及任意多个“hi”的行这是我写的 egrep "^Hi(hi)*!$" myfile.txt 但是没有用。按enter后，命令再次显示: e
regex - egrep 不删除特殊字符
我在使用 egrep 时遇到问题，它似乎忽略了特殊字符，例如 !@#%。目标是删除超过 3 个完全相同字符的行。字符不需要一个接一个。 111!!!qqq! #should be removed b
正则表达式仅使用 egrep 捕获整个单词
我正在使用 egrep 查看我们 perforce NAS 中的脚本。我正在尝试找到我们使用 RCP 和 RSH 的地方....我遇到的问题是 1) 我不擅长 REGEX； 2) 我正在捡起我不感兴
bash - 为什么这两个 egrep 搜索都不返回相同的结果？
我想了解为什么使用 include 参数它不会搜索目标文件 Identification.php。与包括范围 : admin@server:/filer/www/website/httpdocs$
regex - 如何使用 egrep 用逗号和数字搜索特定模式
我有一百万多包含类似于下面的行的文本文件 abc,xyz, =12093| abc,xyz, =12093, =10998| 第一行没问题，但我想找到第二行的所有内容。即我想打印所有作为模式 , =
shell - shell 脚本中的 egrep
任何人都可以在这里帮忙。如果 egrep 不可行，其他建议也将受到高度赞赏。我正在尝试使用“UTL_RECOMP_SLAVE_75”将 egrep 表达式写入 grep ORA-00942，当它位于

首页

博学

6Ren·AI

商城

linux - egrep 不写入文件