gpt4 book ai didi

regex - 如何优化英语单词列表

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:12:25 25 4
gpt4 key购买 nike

我正在寻找使用 sed 或类似的 linux 应用程序优化英语单词表的方法。为了做到这一点,我需要:

删除除 a-z、0-9 或特殊字符以外的所有行

删除 url - 可能检测到“\”字符

删除长度超过 16 个字符且不超过 4 个字符的行。 (5-16 个字符)

最好在 sed 中 =)

谢谢!

最佳答案

sed -nr '/^[[:alnum:]]{5,16}$/p' words
  • -n 表示默认不打印行
  • -r 表示使用“扩展”正则表达式

sed 命令是:

  • /.../ 当我们有匹配的东西时
    • ^...$ 整行只包含
      • [...] 的字符类:
        • [:alnum:] 字母数字字符
      • {5,16} 5 到 16 次之间
  • p 然后我们打印它

关于regex - 如何优化英语单词列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3154246/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com