- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在我的 JavaEE 应用程序中,我使用基于 Atom 的 Google Sites API从非公开的 Google 网站检索内容。本质上,我们将 Google 网站用作轻量级 CMS,并在应用程序中使用 API 检索网站内容以提供给我的在线帮助系统。我已经使用此设置有一段时间了,并且运行顺利。
在我的应用程序中,我需要向在线帮助系统添加全文搜索功能。我知道这个功能请求会在某个时候出现,因此在决定使用 Google 协作平台来托管我的内容时,我检查了协作平台 API 是否支持全文搜索。 It does 。例如,以下 URL 将在整个网站 my-site
中搜索包含关键字 user
的页面。
https://sites.google.com/feeds/content/my.doma.in/my-site?q=user
这有效,并为我提供了预期的结果页面。但它仅适用于用西方语言编写的内容,或者更具体地说,是用空格和标点符号分隔标记/单词的语言。当我对日语内容进行类似搜索时,搜索关键字 ユーザー
:
https://sites.google.com/feeds/content/my.doma.in/my-site?q=%E3%83%A6%E3%83%BC%E3%82%B6%E3%83%BC
我只会得到搜索词显示为裸字符串的结果页面,即由空格或标点符号分隔。由于日语是一种用 scriptio continua 编写的语言,这还不够。页面包含,例如:
ご自身のユーザー基本情報の確認
不会出现在结果中。因此,幕后使用的搜索索引似乎是根据“西方”词汇规则创建的,并且日语内容未正确标记。但是,当我从 Google 网站的搜索此网站字段搜索相同的关键字时,我确实得到了正确的结果。我的结论是存在正确的标记化索引,但似乎不可能将其用于基于 API 的搜索。
为了解决这种情况,我迄今为止探索过以下途径:
"ユーザー"
)。*ユーザー*
)。lang
、hl
(界面语言)、rl
(结果语言),..我很快就没有想法了。在最坏的情况下,我最终将不得不自己检索、标记和索引所有内容并使其可搜索。由于这需要大量的努力,我想知道是否有人遇到过同样的问题并找到了可接受的解决方法或解决方案。
<小时/>我尚未找到解决此问题的完美解决方案,因此我在 Google Apps API 问题跟踪器上提出了一个缺陷:https://code.google.com/a/google.com/p/apps-api-issues/issues/detail?id=3780
经过一番反复讨论,Google 工程师承认问题确实存在,如所描述的那样,并已“在内部提交了问题”。此后,缺陷单一直处于分类状态。如果您和我一样有兴趣看到这个问题得到解决,请花点时间在 Google's issue tracker 上为其加注星标/投票。 .
最佳答案
我知道当您的应用程序无法满足定义的最后期限时等待某人支持处理 API 错误时的感觉。您描述的问题听起来确实像一个错误,因此对于“干净”的解决方案,您必须等到 Google 协作平台团队的人员解决此错误(我已经投了赞成票:)),然后您就可以简单地使用搜索 API。
但是,与此同时,我认为您应该尝试一些解决方法。我可能会建议您一个不同的解决方案,它不能 100% 满足您的需求,但可能有用。例如,配置您的网站以将聚合数据提要公开给具有丰富搜索 API 的提要处理器 - 它可能是一个 RSS 提要,其中包含 Feedly 烧毁的 Google 网站中的所有文章。它具有良好的多语言搜索 API 支持 ( Search the content of a stream ) 以及强大的身份验证来保护您的数据隐私。
作为一名架构师,我知道这不是问题的正确解决方案,但它帮助我构建了一个完全可搜索的应用程序,使用俄语和乌克兰语语言环境聚合来自 100 多个不同数据源的数据。
祝您应用程序开发顺利,请告诉我此解决方案是否对您有帮助! :)
关于full-text-search - Google Sites API 全文搜索不适用于非西方语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26857802/
至少在某些 ML 系列语言中,您可以定义可以执行模式匹配的记录,例如http://learnyouahaskell.com/making-our-own-types-and-typeclasses -
这可能是其他人已经看到的一个问题,但我正在尝试寻找一种专为(或支持)并发编程而设计的语言,该语言可以在 .net 平台上运行。 我一直在 erlang 中进行辅助开发,以了解该语言,并且喜欢建立一个稳
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
我正在寻找一种进程间通信工具,可以在相同或不同系统上运行的语言和/或环境之间使用。例如,它应该允许在 Java、C# 和/或 C++ 组件之间发送信号,并且还应该支持某种排队机制。唯一明显与环境和语言
我有一些以不同语言返回的文本。现在,客户端返回的文本格式为(en-us,又名美国英语): Stuff here to keep. -- Delete Here -- all of this below
问题:我希望在 R 中找到类似 findInterval 的函数,它为输入提供一个标量和一个表示区间起点的向量,并返回标量落入的区间的索引。例如在 R 中: findInterval(x = 2.6,
我是安卓新手。我正在尝试进行简单的登录 Activity ,但当我单击“登录”按钮时出现运行时错误。我认为我没有正确获取数据。我已经检查过,SQLite 中有一个与该 PK 相对应的数据。 日志猫。
大家好,感谢您帮助我。 我用 C# 制作了这个计算器,但遇到了一个问题。 当我添加像 5+5+5 这样的东西时,它给了我正确的结果,但是当我想减去两个以上的数字并且还想除或乘以两个以上的数字时,我没有
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 4 年前。 Improve th
这就是我所拥有的 #include #include void print(int a[], int size); void sort (int a[], int size); v
你好,我正在寻找我哪里做错了? #include #include int main(int argc, char *argv[]) { int account_on_the_ban
嘿,当我开始向数组输入数据时,我的代码崩溃了。该程序应该将数字读入数组,然后将新数字插入数组中,最后按升序排列所有内容。我不确定它出了什么问题。有人有建议吗? 这是我的代码 #include #in
我已经盯着这个问题好几个星期了,但我一无所获!它不起作用,我知道那么多,但我不知道为什么或出了什么问题。我确实知道开发人员针对我突出显示的行吐出了“错误:预期表达式”,但这实际上只是冰山一角。如果有人
我正在编写一个点对点聊天程序。在此程序中,客户端和服务器功能写入一个唯一的文件中。首先我想问一下我程序中的机制是否正确? I fork() two processes, one for client
基本上我需要找到一种方法来发现段落是否以句点 (.) 结束。 此时我已经可以计算给定文本的段落数,但我没有想出任何东西来检查它是否在句点内结束。 任何帮助都会帮助我,谢谢 char ch; FI
我的函数 save_words 接收 Armazena 和大小。 Armazena 是一个包含段落的动态数组,size 是数组的大小。在这个函数中,我想将单词放入其他称为单词的动态数组中。当我运行它时
我有一个结构 struct Human { char *name; struct location *location; int
我正在尝试缩进以下代码的字符串输出,但由于某种原因,我的变量不断从文件中提取,并且具有不同长度的噪声或空间(我不确定)。 这是我的代码: #include #include int main (v
我想让用户选择一个选项。所以我声明了一个名为 Choice 的变量,我希望它输入一个只能是 'M' 的 char 、'C'、'O' 或 'P'。 这是我的代码: char Choice; printf
我正在寻找一种解决方案,将定义和变量的值连接到数组中。我已经尝试过像这样使用 memcpy 但它不起作用: #define ADDRESS {0x00, 0x00, 0x00, 0x00, 0x0
我是一名优秀的程序员,十分优秀!