gpt4 book ai didi

artificial-intelligence - 匹配 'noisy' 名称的算法

转载 作者:行者123 更新时间:2023-11-30 08:22:52 24 4
gpt4 key购买 nike

我有一个应用程序,可以从网络上的不同来源抓取足球结果。不同网站上的球队名称不一致 - 例如,曼联可能在一个网站上称为“Man Utd”,在第二个网站上称为“Man United”,在第三个网站上称为“Manchester United FC”。我需要将所有可能的派生映射回一个名称(“Manchester United”),并对联盟中的 20 支球队(阿森纳、利物浦、曼城等)重复此过程。显然我不希望出现任何糟糕的比赛[例如“曼城”被映射到“曼联”]。

现在我为所有可能的组合指定正则表达式 - 例如“Manchester United”将是“man(chester)?(u|(utd)|(united))(fc)?”;这对于一些网站来说很好,但变得越来越笨拙。我正在寻找一种解决方案,可以避免指定这些正则表达式。例如,必须有一种方法可以为曼联“得分”,以便它在对阵“曼联”时获得高分,但在对阵“利物浦”时获得低分/零分[例如];我会根据所有可能的解决方案测试示例文本,并选择得分最高的一个。

我的感觉是,该解决方案可能类似于训练神经网络识别手写体的经典示例[即,存在一组固定的可能结果,以及输入样本中的一定程度的噪声]

大家有什么想法吗?

谢谢。

最佳答案

看来您正在屏幕抓取相同的来源。

假设您的来源在命名团队时保持一致,则字符串转换将是最有效的解决方案。

曼联 -> 曼联

曼联 -> 曼联

关于artificial-intelligence - 匹配 'noisy' 名称的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3387196/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com