c# - 使用 .NET Regex 进行泰米尔语全词搜索-6ren

c# - 使用 .NET Regex 进行泰米尔语全词搜索

转载作者：太空宇宙更新时间：2023-11-03 12:20:04

26

4

我有一个充满泰米尔语单词和搜索字符串的网格。我需要通过网格记录实现全词搜索。我正在为该方法使用 .NET Regex 类。听起来很简单，我以前做的是:

字符串模式 = @"\b"+ searchText + @"\b"。

它在拉丁语中按预期工作，但对于泰米尔语，此表达式返回奇怪的结果。我已经阅读了有关正则表达式中的 Unicode 字符的信息，但这对我来说似乎没什么帮助。我可能需要确定在哪里找到单词边界以及为什么。

举个例子:对于 "\bஅம்மா\b" 模式正则表达式在அம்மாவிடம்和அம்மாக்கள்记录，但不在原始அம்மா记录中。

最佳答案

“அம்மா”单词的最后一个字符是 0BBE TAMIL VOWEL SIGN AA，它是一个组合标记(在正则表达式中，它可以与 \p{M} 匹配)。

作为\b只匹配字符串的开头/结尾和单词字符或单词和非单词字符之间，它不会在字符和非单词字符之后匹配。

在这种情况下使用通常的解决方法。

var pattern = $@"(?<!\w){searchText}(?!\w)";

参见 this regex demo .

在这里，(?<!\w)如果 searchText 之前有单词 char，则匹配失败和 (?!\w)如果要查找的文本后有单词 char，则匹配失败。请注意，您也可以使用 Regex.Escape(searchText)如果文本可以包含特殊的正则表达式字符。

或者，如果您想避免在基本字母/变音符号内进行匹配，请使用

var pattern = $@"(?<![\p{{L}}\p{{M}}]){searchText}(?![\p{{L}}\p{{M}}])";

参见 this regex demo .

(?<![\p{L}\p{M}])和 (?![\p{L}\p{M}]) lookarounds 的工作方式与上面的类似，只是如果搜索短语的两边有字母或组合标记，它们将无法匹配。

关于c# - 使用 .NET Regex 进行泰米尔语全词搜索，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47789670/

26

4

0

文章推荐： android - 数组反序列化之Gson Array

文章推荐： c# - Newtonsoft Json反序列化报错

apache服务器全局配置详解(全)
Apache服务器全局配置之服务器标识配置篇服务器标识相关指令： ServerName ServerAdmin ServerSignature ServerTokens UseCanonical
JavaScript中常用的正则表达式日常整理(全)
//校验是否全由数字组成 ? 1
日常整理python执行系统命令的常见方法(全)
具体内容如下： 1 os.system 例如 ipython中运行如下命令，返回运行状态status os.system('cat /etc/passwdqc.conf') min=disab
Mysql语句快速复习教程(全)
基本操作查看数据库 ? 1
Xcode使用教程详细讲解(全)
Xcode使用教程详细讲解是本文要介绍的内容，Xcode是一个款强大的IDE开发环境，就像你在写Windows程序时需要VS2005一样需要要Xcode为你写Mac程序提供环境。因此，如果你要成为
PHP图片验证码制作实现分享(全)
就如今天遇到随即函数rand();脑海中想到用它做点啥好呢，最后想起了验证码，数字验证码，字母验证码，中文验证码，可是自己不会呀，咋办呢，上网搜，看别人的代码，开不懂，看视频，听老师讲，将其中所遇到
nginx安装及配置支持php的教程(全)
pcre-7.8.tar.gz 正则表达式下载地址：ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/
IntelliJIDEA一站式配置【全】(提高开发效率)
IDEA常用设置（提高开发效率）本人也是IDEA编译器的忠实用户了，但是有时出于各种原因，比如更换设备等等，IDEA总是需要重新安装配置。这就让我比较苦恼，因为总是记不全自己之前都修改了
iOS获取当前设备型号等信息(全)包含iPhone7和iPhone7P
? 1 2
ThinkPHP 连接Oracle数据库的详细教程[全]
1、操作环境搭建系统：Windows7 旗舰版 64位 PHP环境：wampserver2.2e-php5.4.3-httpd2.2.22-mysql5.5.24 32
ajax - 全 Ajax 站点的优点和缺点？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 去年关闭。 Improve th
Css 全 Angular 问题
我已经为我在 Adobe Fireworks Cs5 中构建的页面生成了 css，我想知道如何为我的标题和其他 div 设置完整宽度。我将显示标题部分的 css 代码。 @charset "utf
html - 全 div 宽度的文本框和按钮
您好，我希望表单宽度为 100%。我希望文本框几乎延伸整个页面的宽度，并在文本框的右侧直接放置小的“GO”按钮，所有按钮都在同一行(或 block )上。现在我的文本框只有其中文本的宽度(“在此处输
css - 全 Angular 页脚不会粘在底部
我没有设法将全宽页脚粘贴到网页底部。当页脚上方的主要内容低于一定高度时，页脚下方有一个空白区域。我尝试使用各种解决方案，例如以下 css 代码: html,body { margin:0; padd
HTML 全 Angular 表格
我想要一个全宽的表格。当我给 position:fixed; 它变成全宽但可滚动不起作用。简而言之，我需要一个与浏览器主体没有任何边距的表格。 body { font-family: "Helv
javascript - 全 Javascript 网页的优点
我注意到很多大型网站(如 Google 和 Facebook)在查看页面源代码时 99% 的源代码都是 JavaScript。有人知道这种方法相对于常规 HTML+JavaScript 页面的优势吗
html - 全 Angular 两列html
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this q
jquery - 全 Angular 问题
由于某种原因，我网站上的图片不再是全宽的。据我所见，所有内容都设置为 100% 宽度。 http://cargocollective.com/btatest 我是不是什么地方都没有？最佳答案我认
CSS 全 Angular 列表元素
我正在创建一个菜单并尝试使用 CSS 制作全宽菜单。但是，我不确定菜单项将如何出现在菜单中。这是问题的截图: 问题出在我得到的“GAP”中。如果我有固定数量的元素，我知道我可以使用这个逻辑: ul
c - 全 1 的最大方阵子矩阵
这个问题在这里已经有了答案: Puzzle: Find largest rectangle (maximal rectangle problem) (6 个答案) 关闭 9 年前。给定一个二元矩阵

首页

博学

6Ren·AI

商城

c# - 使用 .NET Regex 进行泰米尔语全词搜索