gpt4 book ai didi

c# - linq搜索法语字符

转载 作者:行者123 更新时间:2023-11-30 12:17:03 27 4
gpt4 key购买 nike

我使用 EF 并且有一个简单的 LINQ 语句并且想要搜索单词。所以有文本框搜索和提交按钮。

当搜索文本包含 "march" 时,它会找到例如。 "des marchés",但如果我搜索 "marché",则找不到。所以这是法语字符。

listAgendaItems = dc.agenda.Where(a =>
a.libelle_activite.Contains(searchText)
).ToList<agenda>();

数据库和表 Agenda 具有扩展属性 -> Collat​​ion : French_CI_AS

那么我怎样才能确保我也能理解法语单词呢?比如“é, à”等

我还尝试搜索 "marche",但没有找到 "marchés"

最佳答案

您的排序规则 French_CI_AS 是“不区分大小写”、“区分重音”的。如果您希望查询“marches”以匹配“marchés”,您需要将 French_CI_AI 作为排序规则。在大多数语言中,这实际上不是母语人士想要的,因为重音在语义上很重要,但这可能取决于环境或语境。

事实上,如果您的用户确实总是想要不区分重音的搜索,您应该在表(或特定字段)上将该排序规则属性设置为 AI 而不是 AS。否则,如果很少需要,您可以在每个查询的基础上对 MS Sql 中的表应用排序规则;请记住,如果该排序规则没有索引,则可能会产生大量性能成本。但是,当您执行 %wildcard% 查询时,这可能几乎无关紧要,因为在这种情况下您通常会进行全表扫描。

上次我检查时,无法直接在 Linq 查询中指定排序规则,因此如果您临时执行不区分大小写的操作,则需要使用直接到 sql 的查询您的数据上下文。

编辑:根据您的评论,您似乎允许将 HTML 内容存储在您的数据库中。你的表中有数字字符引用,SQL Server 对此一无所知,因为它们是 HTML、XML 和 SGML 的特性。只有当这些字符是采用合适编码的字符串文字时,您才能使其可搜索。

NVARCHAR 将以 Unicode 格式存储内容,特别是 UTF-16,而 VARCHAR 将使用带有法语排序规则的 Windows-1252。

如果您通过网络表单接受此输入,请确保页面编码正确。如果您只支持现代浏览器(基本上是任何 IE5+),那么 UTF-8 得到很好的支持,因此您应该考虑对所有请求和响应使用 UTF-8。

确保在你的 web.config 中,你有这样的东西:

<configuration>
<system.web>
<globalization
requestEncoding="utf-8"
responseEncoding="utf-8" />
</system.web>
</configuration>

如果您的数据库中已经存储了这些数字字符引用的数据,您可以通过翻译 &#dddd; 来取消转义它们。转换为文字 UTF-16 序列,并再次存储它们。确保您不会意外地取消转义语义上重要的 NCR,例如大于、小于或与符号代码点。

关于c# - linq搜索法语字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4317495/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com