- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在使用这个函数:http://www.seoreviewtools.com/multi-keyword-density-checker-php-script/但是我在使用奇怪的法语单词时遇到了一些问题。 (在这里查看我的修改版本:http://pastebin.com/m6PjsizX)
如您所知,str_word_count()
不适用于 UTF-8 字符,可以使用第三个参数来“忽略”这些字符。但是,我没有找到一种方法让它可以使用引号(在法语中很常见)。
法语单引号的三种情况:
我想删除一些引号以便处理 str_word_count()
而不会出错(可能使用正则表达式和 preg_replace()
)以便得到这个结果:
$str = "J'aime la plage d'aujourd'hui, quelqu'un aimerait-il aller chez Super' pour voir l'avion bleue ?");
MagicFunction($str);
$str = str_word_count($str);
echo $str;
aime la plage aujourd'hui, quelqu'un aimerait-il aller chez Super' pour voir avion bleu
此外还有很多引号('、`、'、' 等),我希望它能处理所有类型的引号。
你有解决方案让它以这种方式工作吗?
谢谢!
最佳答案
你似乎想要
j'aime
、l'huile
)的第一个字母代表缩短的单词时,去掉撇号aujourd'hui
、quelqu'un
、 super '
).我建议采用一种方法来删除后跟撇号的单词开头的每一个字母。所有其他情况是当 '
应该在单词的内部,因此必须保持完整。
'~\b\p{L}[\'`‘’]\b~u'
参见 regex demo
$re = '~\b\p{L}[\'`‘’]\b~u';
$str = "J'aime la plage d'aujourd'hui, quelqu‘un aimerait-il aller chez Super’ pour voir l`avion bleue ? l'école L'";
$result = preg_replace($re, "", $str);
echo $result;
// => aime la plage aujourd'hui, quelqu‘un aimerait-il aller chez Super’ pour voir avion bleue ? école L'
注意,在处理 Unicode 字符串时,您必须在每次调用 preg_replace 时使用 /u
修饰符。
关于php - 删除 str_word_count 的一些引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35357365/
我已经创建了下一个函数来从文本中返回特定数量的单词: function brief_text($text, $num_words = 50) { $words = str_word_count
我正在尝试计算用非拉丁语(保加利亚语)编写的变量中的单词数。但似乎 str_word_count() 没有计算非拉丁词。 php文件的编码是UTF-8 $str = "текст на кирилиц
这个问题已经有答案了: Word Count no duplicates (8 个回答) 已关闭10 年前。 注意:我不是在寻找 Java 中的字数统计算法。我问哪里可以找到str_word_coun
我正在使用这个函数:http://www.seoreviewtools.com/multi-keyword-density-checker-php-script/但是我在使用奇怪的法语单词时遇到了一些
我想使用 str_word_count()在 UTF-8 字符串上。 这在 PHP 中安全吗?在我看来它应该是(特别是考虑到没有 mb_str_word_count())。 但是在 php.net 上
str_word_count()函数返回一个数组,该数组包含字符串中的所有单词。它工作得很好,除非使用特殊字符。在这种情况下,php 脚本通过查询字符串接收字符串: 当我打开时: http://loc
我有这样的文字: $text = "Başka, küskün otomobil kaçtı buraya küskün otomobil neden kaçtı kaçtı b
我正在将旧版 PHP 应用程序迁移到 .net,其中一项要求是 URL 与以前完全相同。 为了生成友好的 URL,遗留应用程序使用 str_word_count ,我想知道这个函数是否有 C# 的端口
我正在尝试使用 str_word_count 来计算消息中的字数。 $wordcount = str_word_count($message,0,'0123456789'); 我几乎可以保证那里只有单
我有这段 JS 代码,我认为它等同于 PHP str_word_count() 函数,但它们仍然返回不同的字数。 我的 JS 代码: //element f9 value is: "Yes, for
我是一名优秀的程序员,十分优秀!