gpt4 book ai didi

c# - Word 如何在高级搜索中找到匹配的词形?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:25:13 26 4
gpt4 key购买 nike

我有一个 word 文档,其中出现了“perform”和“performance”。当我在 Word UI 中使用高级查找工具时(目标是最终将其转换为用于 C# 编程搜索的 Find.Execute 命令),当我选中“匹配所有单词形式”选项时,我得到了不同的结果。

当我搜索“perform”时,我同时找到了“perform”和“performance”。
当我搜索“performance”时,我只得到“performance”的匹配项,即使“perform”仍应注册为“performance”的单词形式。

有谁知道 Word 如何使用其搜索算法,或者我如何确保搜索“performance”会同时显示“perform”和“performance”的结果?

编辑(7/11/12 16:34)-
我运行了几个测试组合,看看我是否能为自己找到一个模式,好吧......它并不是那么有前途(大写很重要!?!)。
从中获得这些结果的文档是一个简单的 word 文档,每个单词形式都有大写和小写字母。每次搜索都会找到单词的大写和小写版本。
Here are the results of a few searches and their apparent conclusions(执行“右键单击->在新选项卡中打开图像”以查看全尺寸图像细节)
如果有人可以链接到为我澄清这一点的文档,将不胜感激!

编辑 (7/12/12 9:49)-
更令人难过的是:我尝试从 Word 中的界面切换到 C# 中的 Find.Execute 命令,但 matchSoundsLike 参数的功能与 UI Advanced Find 的功能不同:( 似乎程序化的 matchSoundsLike 标志只能找到声音-喜欢匹配大小写的形式,即使我将 matchCase 显式设置为 false。

最佳答案

这似乎是对 Query Expansion 的改编,信息检索中一个相当重要的领域。

我建议不要自己构建查询扩展引擎,因为这更像是硕士(或可能是博士)论文的项目,而不是大型项目的较小功能。但是,如果您仍然希望自己实现此功能,我建议您从 Google Scholar search for "query expansion" 开始。并阅读一些现代技术。

就预先存在的库而言,大多数包都专注于网络搜索和数据库,所以我很难找到任何用于搜索文本文件的东西。 Google Query Expansion没有明确说明它是 Google API 的扩展,但这是我的印象。 Microsoft SQL Server 似乎have this functionality built-in .有一个 Apache Lucene module这也实现了这一点。 MySQL 也有 an implementation .

如果您希望使用预先存在的包,那么您至少需要修改程序的结构,以便将文本存储在数据库中。这会将您的问题从文本搜索问题转变为语料库搜索问题,这些问题经过了大量研究,并且外部来源将提供更多文档和工具。也就是说,在不知道您的数据的情况下,我不知道这是否是一个有值(value)的解决方案,也不知道您应该选择哪种结构。

祝你好运。很抱歉,我无法直接回答您的问题,但我希望我能为您提供一些有用的信息来源。

关于c# - Word 如何在高级搜索中找到匹配的词形?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11439722/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com