gpt4 book ai didi

ruby - 正则表达式匹配所有字母数字主题标签,没有符号

转载 作者:数据小太阳 更新时间:2023-10-29 07:10:10 28 4
gpt4 key购买 nike

我正在为 facebook 编写主题标签抓取工具,我遇到的每个用于获取主题标签的正则表达式似乎都包含标点符号和字母数字字符。这是我想要的示例:

你好#world!我正在#m4king 一个#fac_book 爬虫,想要一个不错的正则#expression。

我希望它匹配 worldm4kingfacexpression(请注意,我希望如果它到达标点符号(包括空格),它将被切断)。如果它不包含哈希符号就好了,但这不是特别重要。

为了以防万一,我将使用 ruby​​ 的字符串扫描方法来获取可能不止一个标签。

提前致谢!

最佳答案

像这样的正则表达式:#([A-Za-z0-9]+) 应该匹配您需要的内容并将其放在捕获组中。然后您可以稍后访问该组。也许this将有助于阐明正则表达式(来自 Ruby 上下文)。

上面的正则表达式将在找到 # 标签时开始匹配,并将后面的任何字母或数字放入捕获组中。一旦它找到任何不是字母或数字的东西,它就会停止匹配。最后,您将得到一个包含您所追求的内容的组。

关于ruby - 正则表达式匹配所有字母数字主题标签,没有符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12576392/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com