gpt4 book ai didi

php - 在 php 中使用 preg_split 从字符串中获取单词

转载 作者:可可西里 更新时间:2023-11-01 00:06:04 25 4
gpt4 key购买 nike

我正在尝试像这样使用 preg_split 从 php 中的字符串中获取单词:

$result = preg_split('/[^A-Za-z]+/', $text)

但这不行,有些词被拆分了,我做错了什么?

编辑:事实是它不适用于俄语文本 = "фыва ывафы фываф";

$result = preg_split('/[^А-яа-я]+/', $text)

最佳答案

[^A-Za-z] 只考虑 ASCII 字母。您需要拆分 Unicode 非字母:

$result = preg_split('/\P{L}+/u', $subject);

[^А-Яа-я]+ 也不起作用,因为在 Unicode 字符集中,А (0x0410) 不是第一个 Kyrillian 字母,并且я (0x044F) 不是最后一个。这些荣誉似乎属于 Ё (0x0401) 和 ӹ (0x04F9)。我根本不懂俄语,所以我无法推测为什么会这样。

您可以使用字符映射程序轻松检查:

screenshot charmap

关于php - 在 php 中使用 preg_split 从字符串中获取单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13329104/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com