gpt4 book ai didi

java - 有哪些实用(且轻量级)的语义/数据匹配技术?

转载 作者:太空宇宙 更新时间:2023-11-04 08:51:38 24 4
gpt4 key购买 nike

我有一个允许用户发布非结构化关键字的应用程序。同时,其他用户可以发布必须与一个或多个指定关键字相匹配的项目。对于任何一组用户可以使用的关键字都没有限制,因此,当现实情况是用户可能对同一事物使用不同的关键字或者它们足够接近时(例如“自行车”和“骑自行车”,或“肉”和“食物”),仅仅希望发生冲突可能意味着很少的匹配。

我需要它在移动设备 (Android) 上工作,因此我很乐意牺牲匹配精度来提高效率和占用空间小。我知道s-match但这依赖于 15MB 的支持字典,因此并不理想。

还有哪些其他想法/方法/框架可能对此有所帮助?

最佳答案

您的“自行车”和“骑自行车”示例可以通过采用 Levenshtein 编辑距离算法来解决,因为这两个词有些相关。但是你的“肉”和“食物”的例子确实需要一个相当大的支持字典,当然,除非概念集或目标受众仅限于美食家。

您是否考虑过将字典作为 Web 服务托管并根据需要访问数据?当然,缺点是您的应用程序只能在网络覆盖范围内运行。

关于java - 有哪些实用(且轻量级)的语义/数据匹配技术?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3189112/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com