- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试计算存储在 utf8mb4_bin 上的 MySQL DB 文本集中的一组阿拉伯语子字符串。这php 文件也设置为 utf-8,因此单词实际上可以正确显示。
到目前为止,我可以计算除阿拉伯语之外的任何语言的任何子字符串(日语、韩语、泰语、英语等......工作正常),但无法让阿拉伯语工作。
mysqli_query($conn, "SET NAMES utf8mb4");
$query_main = mysqli_query($conn, "SELECT word FROM lang_dicc WHERE lang = ".$lang." ORDER BY value;");
while ($query = mysqli_fetch_assoc($query_main) ){
$vector_1[$i] = mb_substr_count( $text, $query["word"]);
}
我已经将 php.ini 文件设置为:
mbstring.func_overload = 7
我很困惑,因为 strpos() 实际上可以找到子字符串...
我疯狂猜测是不是写反了?我对此完全迷失了。特别是因为我看不懂这些单词,我不知道它们是否是倒着的。
如果对此有任何见解,我将不胜感激。
-谢谢
最佳答案
我最近在阿拉伯语方面遇到了类似的问题,根据我的简短研究,我可以看到它在任何地方都没有得到解释,因此,无论很久以前就有人问过这个答案,我都会把这个答案留在这里。
简短回答
我们可以使用
iconv_strlen("نص بالعربي");
解释为什么普通的 substr/strlen 不起作用,是因为每个阿拉伯字母被计为两个字节。例如,
print("نص بالعربي" . ": " . strlen("نص بالعربي"));
print("نص بالعربي" . ": " . iconv_strlen("نص بالعربي"));
这些将输出
年龄: 19
人数:10
普通的 strlen 计算字节数。该字符串有 9 个阿拉伯字符和 1 个空格。 92 + 11 = 19。
第二个输出了 10,因为它计算的是字符而不是字节。
与 substr 相关的奇怪行为
打印阿拉伯字符串效果很好。但是,打印字符串的字母将导致打印问号。
// substr( string, startIndex, Length);
$name = "محمد";
print($name);
print($name[0]);
print(substr($name, 0, 1));
print(substr($name, 0, 2));
输出:
嗯嗯
�
�
在提取字符串的一部分时,可以使用以下方法来代替乘二或除二
// mb_substr( string, startIndex, Length);
关于php - 如何在 PHP 上使用 substr_count 计算阿拉伯语子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26313270/
我正在使用 Solr 以 3 种语言(阿拉伯语、法语和英语)索引文档,我使用了这个 fieldType :
当我在设备(它的语言是阿拉伯语)中运行我的应用程序时,我感到震惊的是,应该在正确方向的对象会向左移动,反之亦然。 后来我意识到是阿拉伯语本地化的自动布局导致了这个问题。 我以编程方式设置自动布局如下:
我想一个字母一个字母地拆分阿拉伯语单词,将它们涂成不同的颜色并在其上添加事件处理程序。 Image, how it looks like 我实现了关于绘画的部分想法,并处理了辅音字母 (harf),但
我关注 this教程,一切都很好,我预处理和训练我的模型但是当我想找到与以下代码的相似之处时: model = gensim.models.Word2Vec.load("wiki.fa.word2ve
我在使用阿拉伯语文本进行变音符号不敏感搜索时遇到问题。 我已经为相关表格测试了多种设置:utf8 和 utf16 编码以及 utf8_general_ci、utf16_general_ci 和 utf
我正在评估 NLTK 在分析和提取情绪的研究中处理阿拉伯文本的能力。 问题如下: NTLK 是否能够处理并允许分析阿拉伯文本? python 是否能够操作\标记阿拉伯文本? 我能否使用 Python
我正在使用 PHPMailer API 发送电子邮件。我想知道如何用阿拉伯语(非英语)发送主题 $mail->CharSet = 'utf-8'; $array= FetchTable('cos
在过去的 15 天或更长时间里,我一直在为一个奇怪的问题而苦苦挣扎。实际上我有一些阿拉伯语文本,但也有一些英文文本。 MY NAME "some arabic text" "some arabic t
我想用阿拉伯语制作一个 flutter 日期选择器,但有一些变化,这是我的代码: locale: Locale('ar', 'MA'), localizationsDelegates: [
我一直在努力为移动应用程序寻找良好的国际日历支持(包括 Hirji)。我的主要限制是 JVM 是 1.3 并且我们只有 AWT。有一个选项可以转移到另一个为我们提供 SWT 的 JVM,但我似乎找不到
我的应用程序是用英语和阿拉伯语两种不同版本开发的。 我在 iText 中使用 rowspan 和 colspan 创建了 pdf 表格,这在英文版中运行良好,但在阿拉伯语版 rowspan 中不起作用
我想将阿拉伯语单词分割成单个字符。基于直方图/配置文件,我假设我可以通过根据其基线(它具有相似的像素值)剪切/分割字符来进行分割过程。 但是,不幸的是,我仍然坚持构建适当的代码,以使其工作。 % Or
我在 JavaScript 函数中遇到了问题 var tDate = new Intl.DateTimeFormat("ar-US", { day: 'numeric', month: 'lo
我已经编写了 java 代码,我希望在 PdfPTable 上显示阿拉伯文字,该 PdfPTable 被用于 itext 文档以创建 PDF 文档 如附图“???”是阿拉伯代码' PdfPTable
简单地说,有没有支持Lucene.Net的Arabic Analyzer。因为我想索引大量的阿拉伯语 txt 文件。我可以使用标准分析器或空白分析器来解析阿拉伯文文件吗? analyzer = new
我正在使用 Vuejs,我想防止输入标签显示用户的字符并将其替换为我自己的字符(这是一些数字)。 我已经在计算中使用了@onchange 和 Watch 以及 getter 和 setter。问题是字
我正在研究 RTL 功能。我从数据库中获取字符串值作为 (f1 (firstname。但我想要 f1 (firstname) 这是我的 javascript 代码。下面的代码运行良好 EN语言。它不仅
我已经下载了阿拉伯语格式的阿拉伯语语言包和编辑器显示,但是当我纠正一些它不是用正确的方向写它总是从左方向开始,阿拉伯语总是从右方向开始但是这是行不通的.. 我的代码——
我使用的是 3.8.2 版本,插入新记录时,utf8 字符串在数据库中显示为问号 (?),但它会正确显示旧记录(使用 phpmyadmin 插入)。 这是我如何初始化 MySQLPool fun in
我有一个阿拉伯语短信模板,其中包含客户支持号码的占位符,并将占位符替换为实际电话号码(例如 +987654400)。替换时加号 (+) 错位在数字末尾,如 987654400+ 示例代码: >>> >
我是一名优秀的程序员,十分优秀!