gpt4 book ai didi

使用文本搜索查找所有可能结果的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:27:33 24 4
gpt4 key购买 nike

我目前正在制作一个网络爬虫来爬取视频游戏网站(最终幻想 XIV Lodestone)上所有可能的角色。

我执行此操作的界面是使用网站的搜索。 http://lodestone.finalfantasyxiv.com/rc/search/characterForm

如果搜索找到超过 1000 个字符,它只返回前 1000 个。文本搜索似乎也不理解 *,?或 _.

如果搜索字母 a,我会得到名称中包含 a 的所有字符,而不是所有以 a 开头的字符。

我猜我可以搜索所有字符组合 aa、ab、ba 等。但这并不能保证我:

  • 我永远不会得到超过 1000 个结果
  • 看起来效率不高,因为很多字符会出现多次,需要过滤掉。

我正在寻找一种算法来构建我的搜索文本。

最佳答案

作为一个实际问题,您是否向 Square Enix 请求某种 API 访问或数据库转储?他们可能更愿意这样做,而不是让您抓取他们的搜索结果。

纯粹从抽象的角度考虑,尚不清楚任何搜索策略都能成功找到所有结果。假设有一个名为“Ar”的字符,您将如何找到它?如果您搜索“ar”,结果只会到 Ak—。如果搜索“a”或“r”,情况更糟。任何其他搜索都找不到此字符。 (在实践中,您可能可以通过猜测其世界和/或主要技能来找到“Ar”,但理论上,该世界上可能有太多具有该技能的角色,因此这仍然无效。)

关于使用文本搜索查找所有可能结果的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4251042/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com