gpt4 book ai didi

javascript - 单词边界的正则表达式,但包括表情符号

转载 作者:塔克拉玛干 更新时间:2023-11-02 21:10:33 24 4
gpt4 key购买 nike

<分区>

我有一个文本语料库,我正在使用正则表达式对其进行解析以查找最常见的单词。目前我正在使用 .match(/(?!'.*')\b\[\w'\]+\b/g) .我的问题是 \w 与非字母数字字符不匹配,我的表情符号永远不会被解析。具体来说,我正在尝试制作一个正则表达式来识别单词(包括缩写)和表情符号,在单词边界上分开。

举个例子,我希望能够接受“嘿!👋,让我们去月球🌝🚀”并得到

Array( "Hey", "there", "👋", "let's", "go", "to", "the", "moon", "🌝", "🚀")

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com