gpt4 book ai didi

tags - 如何解决基于标签的网站的语义问题

转载 作者:行者123 更新时间:2023-12-04 23:02:51 25 4
gpt4 key购买 nike

基于标签的网站经常遭受同义词、同音异义词等语言的微妙影响。对于寻找信息的程序员,比如在 Stack Overflow 上,具体示例是:

  • Subversion 或 SVN(或 svn,标签区分大小写)
  • .NET 或 Mono
  • [将添加更多]

问题是我们确实想保留我们语言的精巧,让机器尽可能好地处理它。

像 del.icio.us 这样的网站发现它的标签基数增长了很多,因此可能会阻碍使用或搜索。搜索与 SVN 相关的条目可能会列出大多数同时带有 subversion 和 svn 标签的条目,但我可以想到三个问题:

  1. 搜索不完整,因为许多条目可能没有两个标签(它们是“同义词”)。
  2. 搜索的用处不大,因为问答通常会带来更多的问答!特别是对于给定主题的新手。
  3. 标记问题(注意:或单独回答,听起来很有用)变得哲学化:“我标记的方式正确吗?”

解决这些问题的一种方法是在标签之间创建语义链接,以便系统自动绑定(bind) subversion 和 SVN,而不是可怜的用户。

这是一种听起来不错/可行/有吸引力/有用的方法吗?如何高效实现?

最佳答案

识别同义词和语义联系是人类擅长的;通过找到一种将匹配留给人类的方法,组织开放式分类法(如 SO 所具有的特征)的解决方案可能会得到很好的服务。

一种通用方法:某人(或某个团队)每天审查标签。新的同义词被添加到同义词组中。搜索命中同义词组(或者,更细微的,根据用户偏好命中文字匹配或同义词组匹配)。

这需要在后端支持同义词组(为开发团队工作)。它需要一个或十个标签管理员(为负责人或受信任的用户工作)。不过,它不需要不断扩展——总标签池的增长速度很可能(在公开测试版最初的 Here Comes Everybody bump 之后)很可能下降 随着时间的推移,就像任何有机词典的增长率一样。

同义词让我印象深刻。分层映射是一个雄心勃勃且更复杂的问题;它可能值得也可能不值得,但考虑到定义层次结构的相对复杂性,最好将它作为任何潜在同义词项目的第 1 阶段的第 2 阶段。

关于tags - 如何解决基于标签的网站的语义问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21422/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com