gpt4 book ai didi

正则表达式匹配后牙槽辅音

转载 作者:行者123 更新时间:2023-12-04 08:11:52 25 4
gpt4 key购买 nike

我有一个名为 a.txt 的文本文件,其中包含以下元素:

fall#i#1    fall (as a fruit) (v.)  fall    jatuh   fall (as a fruit) (v.)  jatuh*  t͡ʃampaʔ
dog#n#1 dog dog anjing dog anjing ŋand͡ʒi
wing#n#1 wing wing sayap wing sayap kopaʔ
fly#i#1 fly (v.) fly (vb) terbang fly (v.) terbang tobaŋ
mosquito#n#1 mosquito mosquito nyamuk mosquito nyamuk ɲamuʔ
flower#n#2 flower flower bunga (yg jadi buah), kuntum flower bunga* buŋo
sky#n#1 sky sky langit sky langit* ʔlaŋɪt
首先,我需要一个正则表达式来匹配具有最终后牙槽辅音的行,如 [ŋɡʔ] 输出应如下所示:
fall#i#1    fall (as a fruit) (v.)  fall    jatuh   fall (as a fruit) (v.)  jatuh*  t͡ʃampaʔ
wing#n#1 wing wing sayap wing sayap kopaʔ
fly#i#1 fly (v.) fly (vb) terbang fly (v.) terbang tobaŋ
mosquito#n#1 mosquito mosquito nyamuk mosquito nyamuk ɲamuʔ
其次,我需要一个正则表达式来匹配单词开头的后牙槽骨,输出应该是这样的:
dog#n#1 dog dog anjing  dog anjing  ŋand͡ʒi
sky#n#1 sky sky langit sky langit* ʔlaŋɪt
第三,我需要一个正则表达式来匹配像这样输出的元音之间的后齿槽:
flower#n#2  flower  flower  bunga (yg jadi buah), kuntum    flower  bunga*  buŋo
sky#n#1 sky sky langit sky langit* ʔlaŋɪt
我曾经在 Ubuntu 终端中使用这个正则表达式来匹配它们:
grep -P '\b[ʔŋɡk]|[ʔŋɡk]\b|[aiueo][ʔŋɡk][aiueo]' a.txt
但我找不到一个正则表达式来分别匹配它们我的意思是,一旦在最后匹配后牙槽骨,另一个正则表达式匹配仅在开头和元音之间的另一个正则表达式匹配,任何人都可以帮助我,谢谢

最佳答案

您可以使用的正则表达式是

grep -P '(*UCP)[ŋɡʔ]\b' file           # 1
grep -P '(*UCP)\b[ŋɡʔ]' file # 2
grep -P '[aiɪueo][ʔŋɡk][aɪiueo]' file # 3
在哪里
  • (*UCP)[ŋɡʔ]\b - 匹配 ŋ , ɡʔ后跟一个 Unicode 感知(由于 (*UCP) PCRE 动词)词边界
  • (*UCP)\b[ŋɡʔ] - 匹配 ŋ , ɡʔ前面带有 Unicode 感知(由于 (*UCP) PCRE 动词)词边界
  • [aiɪueo][ʔŋɡk][aɪiueo]匹配 ŋ , ɡ , kʔ中间a , i , ɪ , u , eo元音( 注意 iɪ 不是同一个字母!)

  • grep demo :
    s='fall#i#1    fall (as a fruit) (v.)  fall    jatuh   fall (as a fruit) (v.)  jatuh*  t͡ʃampaʔ
    dog#n#1 dog dog anjing dog anjing ŋand͡ʒi
    wing#n#1 wing wing sayap wing sayap kopaʔ
    fly#i#1 fly (v.) fly (vb) terbang fly (v.) terbang tobaŋ
    mosquito#n#1 mosquito mosquito nyamuk mosquito nyamuk ɲamuʔ
    flower#n#2 flower flower bunga (yg jadi buah), kuntum flower bunga* buŋo
    sky#n#1 sky sky langit sky langit* ʔlaŋɪt'
    grep -P '(*UCP)[ŋɡʔ]\b' <<< "$s"
    echo "----"
    grep -P '(*UCP)\b[ŋɡʔ]' <<< "$s"
    echo "----"
    grep -P '[aiɪueo][ʔŋɡk][aɪiueo]' <<< "$s"
    输出:
    fall#i#1    fall (as a fruit) (v.)  fall    jatuh   fall (as a fruit) (v.)  jatuh*  t͡ʃampaʔ
    wing#n#1 wing wing sayap wing sayap kopaʔ
    fly#i#1 fly (v.) fly (vb) terbang fly (v.) terbang tobaŋ
    mosquito#n#1 mosquito mosquito nyamuk mosquito nyamuk ɲamuʔ
    ----
    dog#n#1 dog dog anjing dog anjing ŋand͡ʒi
    sky#n#1 sky sky langit sky langit* ʔlaŋɪt
    ----
    flower#n#2 flower flower bunga (yg jadi buah), kuntum flower bunga* buŋo
    sky#n#1 sky sky langit sky langit* ʔlaŋɪt

    关于正则表达式匹配后牙槽辅音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65914231/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com