gpt4 book ai didi

javascript - 提取网页中的所有链接

转载 作者:行者123 更新时间:2023-12-03 07:07:21 28 4
gpt4 key购买 nike

我想提取印度所有政府网站的列表以供我的调查。

该列表可以在这里找到: http://goidirectory.nic.in/index.php

这里的问题是列表不是链接的形式。每当我需要打开一个网站时,它都会打开一个新选项卡,然后从那里重定向到所请求的网站。

因此,google klipper 和其他从网站提取链接的工具无法正常工作。

我对javascript一无所知。

我注意到的一件事是,当我将鼠标指针放在链接上时,它会显示网站链接的名称,如下所示:

Mouse pointer

例如http://presidentofindia.gov.in成为亮点。

我需要此类网站链接的列表

谢谢

最佳答案

您好,请检查https://jsfiddle.net/9b0wL9tn/

jQuery

$(document).ready(function(){
$('a').each(function(){
console.log($(this).attr('href'));
});
});

注意:在 Chrome 中打开网站 >> 右键单击​​ >> 检查 >> 转到控制台选项卡并粘贴以下内容,然后按 Enter

首先在控制台上运行此代码:

var jq = document.createElement('script');
jq.src = "https://ajax.googleapis.com/ajax/libs/jquery/2.1.4/jquery.min.js";
document.getElementsByTagName('head')[0].appendChild(jq);
// ... give time for script to load, then type.
jQuery.noConflict();

然后运行这个

$('a').each(function(){
console.log($(this).attr('href'));
});

这将列出页面上的所有链接,只需从控制台复制即可

更新

按照前面的步骤更新了脚本...在控制台中运行以下脚本:

var arr=new Array();
jQuery('a').each(function(i){


arr[i]=jQuery(this).attr('title')+"";


});

jQuery.each(arr,function(i){
if(arr[i].indexOf('http')>-1)
console.log(arr[i].substr(0, arr[i].indexOf('-')));
});

这是屏幕截图:http://www.imageno.com/lj7tuyr9pt2opic.html

关于javascript - 提取网页中的所有链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36760652/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com