- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我对我在自定义分析器(以及 fr.microsoft 分析器)中注意到的特殊行为有疑问。下面的分析 API 测试是使用“fr.microsoft”分析器显示的,但当我使用“text_contains_search_custom_analyzer”自定义分析器时,我看到了相同的行为(这很有意义,因为我将其基于 fr.microsoft 分析器)。
UAT 报告称,当他们搜索“femme”(单数)时,他们希望也能找到包含“femmes”(复数)的文档。但是,当我使用分析 API 进行测试时,Azure 搜索服务似乎仅标记复数 -> 复数 + 单数,但在标记单数时,仅使用单数标记。请参阅下面的示例。
有没有办法允许用户搜索单词的单数版本,但仍然在搜索结果中包含该单词的复数版本?或者我需要使用同义词来解决这个问题吗?
使用“femme”请求 { “分析器”:“fr.microsoft”, “文本”:“女性” }
来自“femme”的回应{ "@odata.context": "https://EXAMPLESEARCHINSTANCE.search.windows.net/ $metadata#Microsoft.Azure.Search.V2016_09_01.AnalyzeResult", “ token ”:[ { “ token ”:“女性”, “开始偏移”:0, “结束偏移”:5, “位置”:0 } ]}
使用“femmes”请求{ “分析器”:“fr.microsoft”, “文本”:“女性”}
“女性”的回应{ "@odata.context": "https://EXAMPLESEARCHINSTANCE.search.windows.net/ $metadata#Microsoft.Azure.Search.V2016_09_01.AnalyzeResult", “ token ”:[ { “ token ”:“女性”, “开始偏移”:0, “结束偏移”:6, “位置”:0 }, { “ token ”:“女性”, “开始偏移”:0, “结束偏移”:6, “位置”:0 } ]}
最佳答案
您正在使用 Analyze API它使用文本分析器,这与使用 Search API 进行搜索不同。 .
文本分析器是在构建索引时支持搜索引擎的,索引实际上是搜索引擎的底部。为了构建搜索索引,需要对进入其中的文档进行分析,这就是分析器的用武之地。它们可以理解不同的语言,可以解析文本并生成if 的意义,即拆分单词、删除停用词、理解句子等。或者正如他们在文档中所说:https://learn.microsoft.com/en-us/rest/api/searchservice/language-support
Searchable fields undergo analysis that most frequently involves word-breaking, text normalization, and filtering out terms. By default, searchable fields in Azure Search are analyzed with the Apache Lucene Standard analyzer (standard lucene) which breaks text into elements following the "Unicode Text Segmentation" rules. Additionally, the standard analyzer converts all characters to their lower case form.
所以您所看到的实际上是完全正确的,法语分析器会分解您发送的单词并从文本中返回可能的标记。对于第一个文本,它找不到除“femme”之外的任何其他可能的标记(我猜法语中没有像“fem”或“femm”这样的其他单词?),但对于第二个文本,它可以找到“femme”和“女性在那里。
所以,您所看到的是文本分析器的自然功能。
另一方面,使用搜索 API 搜索相同的文本应该返回同时包含“femme”和“femmes”的文档,如果您设置了正确的设置用于可搜索字段的分析器(例如 fr.microsoft)。默认的“标准”分析器不处理同一单词的复数和其他变形。
关于Azure 搜索 : Searching for singular version of a word, 但结果中仍包含复数版本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42094690/
当我使用 Singularity 版本 3.2.0 从沙箱文件夹创建 .sif 图像时,在另一台机器上运行 Singularity 版本 2.6 时收到以下错误: ERROR : Unknown i
我在 R 中有这两个列表: y=c(420.5568, 693.6305, 420.5568, 946.9677, 499.1046, 946.9677) x=c(32, 29, 32, 27, 31
当我使用 anova_test() 函数(来自 rstatix 包)做双向重复测量方差分析时,出现错误: lm.fit(x, y, offset = offset, singular.ok = sin
我一直在尝试对数据集进行 2-Way 重复测量测试,年份和疫苗类型是自变量,覆盖率是因变量。我用代码运行它: sat = anova_test( data=SA, dv = coverage, w
我有一个为我制作的奇点容器(用于在 comet GPU 节点上运行 tensorflow),但我需要为我的目的修改 keras 安装。 我知道 .simg 文件不可编辑(并且可写的 .img 格式已弃
我正在解决简单的优化问题。该数据集有 26 列和 3000 多行。 源代码看起来像 Means <- colMeans(Returns) Sigma <- cov(Returns) invSi
我的程序应该是 编写一个程序,根据以下规则接受名词并形成其复数形式: 如果名词以“y”结尾,则删除“y”并添加“ies”。 如果名词以“s”、“c”、“ch”或“sh”结尾,请添加“es”。 在所有其
我正在为我的一个应用程序使用 Lombok。 我有一个用注释 @Builder 声明的类。这些字段用 @SerializedName("xxxxx") 注释以支持 Gson。 但是,其中一个字段是 L
我们在映射中使用了 minimal_english 词干过滤器。这是为了确保只有单数和复数是可搜索的,而不是相似的词。例如。 Test 和 Tests 应该在输入词条时可搜索 - Test - 但是
我有一个图像矩阵。每行 2 个图像,一个宽度为 1/3,另一个宽度为 2/3,两者之间有一个装订线。所有图像都具有完全相同的高度。但是,如果在某些视口(viewport)处减小视口(viewport)
在Singularity的应用中,有几个方面我还有些疑惑。例如,我想知道一件事。在下面的要点中,我设置了一些简单的元素。底部的蓝色是页脚,中间的黄色是内容,上面的三个单元格(红色、绿色紫红色 - 由
我的代码有错误,希望你能帮助我!:(当我粘贴代码时会发生一些奇怪的事情(并非所有代码都像代码一样编写)但我们开始吧: 我想要 linalg.solve(A,Res) 。第一个(A)有 10 行和 10
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
当我在 Singularity 容器中运行特定的 ImageMagick 转换命令(以生成动画 GIF)时,它始终出现内存错误: convert-im6.q16: cache resources ex
关闭。这个问题是 opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便可以通过 editing this post 的事实和引用来回答它。 已关闭 9 年前。 Impro
我想生成一个具有 N(0, C) 分布的随机 vector ,即平均值为 0 且给定协方差矩阵 C 的正态分布。 我正在使用MultivariateNormalDistribution来自 Apach
我偶尔会看到错误消息: CGAffineTransformInvert: singular matrix 在 Xcode 的日志区域。当我在 UIWebView 中捏合以调整网站大小时,这似乎会发生(
我正在尝试在 View 上制作此动画,将其缩放到 (0,0),然后使用 CGRectMake 方法移动此帧并将其缩放回 (1,1)。所以我用下面的代码来做到这一点 -(void)startWalkAn
下面的调用: rbf = Rbf(points[0], points[1], values,epsilon=2) 导致错误: LinAlgError: singular matrix 具有以下值: I
错误 Numpy error: Matrix is singular 具体是什么意思(使用 linalg.solve 函数时)?我在 Google 上查看过,但找不到任何可以说明此错误发生时间的信息。
我是一名优秀的程序员,十分优秀!