gpt4 book ai didi

information-retrieval - 用于在网站上查找联系方式的脚本或库

转载 作者:行者123 更新时间:2023-12-02 01:25:48 27 4
gpt4 key购买 nike

有人知道在网站上查找最相关的联系信息的脚本/食谱/库吗?

一些可能的情况:

  • 在个人网页上查找联系电话号码
  • 在博客上查找所有者电子邮件地址
  • 查找联系页面的网址

最佳答案

查看WSO2's Mashup Server 。您可以在本地计算机上运行它并按照 scraping 的教程进行操作。 。您可以将所需的动态参数传递到 <http> 中抓取器的元素循环遍历运行相同抓取的多个站点,然后将所有内容推送到收集源(用于捕获信息或存储在 WSO2 服务器内的 AJAX 应用程序)。您可以使用 XPath 和 XSLT 编写非常复杂的搜索模式来捕获所需的信息。

我没有足够的关于您正在抓取的特定网站的信息来帮助编写脚本,但无论您采取什么方式,都需要进行大量的试验和错误,直到获得您正在寻找的结果。

祝您抓取愉快!

关于information-retrieval - 用于在网站上查找联系方式的脚本或库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7328559/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com