gpt4 book ai didi

php - 在数据库中搜索具有不同书写或拼写的单词

转载 作者:行者123 更新时间:2023-11-29 02:27:40 26 4
gpt4 key购买 nike

我打算用 php 语言和 mysql 数据库编写一个邮件服务器脚本。我必须在我的编程 TODO 中加入搜索 im 电子邮件工具,但是有一个问题

有些词在某种语言中具有相同的风格和不同的编码

例如 كتابيکتابیکبکكبك这些工作可以通过用户计算机键盘布局相互使用

كتابيكبك 是阿拉伯语布局但是 کتابیکبک 是波斯语布局

我尝试使用 str_replace 函数查找一种语言单词并将其更改为另一种语言单词,但这不是很有用,因为我不知道世界上所有语言中的这些类型的单词

这些词没有任何标准吗?!

最佳答案

我对阿拉伯语和波斯语一无所知,所以我不明白词尾字母 ي 之间的区别。第一个来自您的阿拉伯语示例,其下方有一个变音符号,而第二个则没有。

但是,很明显,这些字符是 unicode 编码的。这不是您要处理的具体键盘,而是键盘编码的 unicode 字符。这些字母的阿拉伯语和波斯语解释彼此不同。

第一个是064A:http://www.fileformat.info/info/unicode/char/064a/index.htm

第二个是06CC:http://www.fileformat.info/info/unicode/char/06cc/index.htm

在你的专栏上这样做

SELECT CONVERT(table.word USING cp1256) 
FROM table

将为波斯语字母(阿拉伯语代码页 cp1256 中缺少的字母)添加替换字符 (?),例如将 کتابی 转换为 ?تاب?。这可能会帮助您检测需要处理哪些字母。

但是,您将需要制定音译方案。这可能是一定量的工作。

关于php - 在数据库中搜索具有不同书写或拼写的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18667889/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com