gpt4 book ai didi

php - 使用 preg_match_all 从字符串中提取单词

转载 作者:行者123 更新时间:2023-12-02 00:06:05 25 4
gpt4 key购买 nike

我不擅长正则表达式,但我想用它从字符串中提取单词。

我需要的单词至少应有 4 个字符,并且提供的字符串可以是 utf8。

示例字符串:

Sus azahares presentan gruesos pétalos blancos teñidos de rosa o violáceo en la parte externa, con numerosos estambres (20-40).

期望的输出:

Array(
[0] => azahares
[1] => presentan
[2] => gruesos
[3] => pétalos
[4] => blancos
[5] => teñidos
[6] => rosa
[7] => violáceo
[8] => parte
[9] => externa
[10] => numerosos
[11] => estambres
)

最佳答案

如果要查找的单词是 UTF-8(根据规范,至少 4 个字符长),由 ISO-8859-15 的字母字符组成(这适用于西类牙语,也适用于英语、德语),则此方法有效、法语等):

$n_words = preg_match_all('/([a-zA-Z]|\xC3[\x80-\x96\x98-\xB6\xB8-\xBF]|\xC5[\x92\x93\xA0\xA1\xB8\xBD\xBE]){4,}/', $str, $match_arr);
$word_arr = $match_arr[0];

关于php - 使用 preg_match_all 从字符串中提取单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10684183/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com