gpt4 book ai didi

php - 棘手的模式匹配

转载 作者:行者123 更新时间:2023-12-03 04:50:17 24 4
gpt4 key购买 nike

这可能很棘手,很容易或不可能......我不确定

我有一个域列表,我正在尝试将它们与“标题”标记中的网站名称尽可能匹配。

例如...

Domain: www.yahoo.com Title: Yahoo!Result: Yahoo!Domain: www.thegreenpages.com Title: Welcome to The Green Pages.Result: The Green PagesDomain: www.experts-exchange.com:Title: Experts Exchange - The #1 resource on the web for solving technology problems.Result: Experts Exchange

所以你可以在这里看到问题。我需要考虑大小写、空格和任何域特殊字符。我还需要捕获任何特殊字符,例如!在雅虎!但不是像句号这样的东西,它只是一个句子的结尾或者你能想到的任何其他东西。

有道理吗?

在 PHP 中。

我真的非常不擅长这些类型的模式匹配问题:)

最佳答案

我不确定您是否会想出一种模式来解决您可能遇到的此类问题的所有可能性。标题标签可能是完全随机的文本,根本不匹配。

例如,这是我从随机谷歌搜索中挑选的一个随机网站。该网站的域名是“plus2net.com”,标题是(显然是为了SEO)“PHP HTML MySQL 文章教程、免费脚本和编程论坛”。您如何将这两件事联系起来?理论上你可以使用类似 levenshtein() function 的东西给你一种统计分析,但我认为用正则表达式来解决这个问题是错误的方法。

我会重新思考这个问题。你想达到什么目的?如果您只是尝试将域名列表和标题标签关联起来,难道您不能编写一个快速脚本来从您拥有的域名列表中抓取标题标签并获取准确的数据吗?

关于php - 棘手的模式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/780852/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com