gpt4 book ai didi

xpath - Scrape Instagram Web Hashtag帖子

转载 作者:行者123 更新时间:2023-12-03 15:46:51 30 4
gpt4 key购买 nike

我试图将帖子的数量刮到给定的标签(#castles),并使用ImportXML填充Google表格单元格。

我尝试从Chrome复制Xpath并将其粘贴到像这样的单元格中的ImportXML参数中:

=ImportXML("https://www.instagram.com/explore/tags/castels/", "//*[@id="react-root"]/section/main/header/div[2]/div/div[2]/span/span")


我看到引号存在问题,所以我也尝试了:

=ImportXML("https://www.instagram.com/explore/tags/castels/", "//*[@id='react-root']/section/main/header/div[2]/div/div[2]/span/span")


但是,两者都返回错误。

我究竟做错了什么?

附言我知道元标记描述 "//meta[@name='description']/@content"的Xpath,但是我想抓取帖子的确切数目,而不是缩写的数目。

最佳答案

试试这个 -

function hashCount() {
var url = 'instagram.com/explore/tags/cats/';
var response = UrlFetchApp.fetch(url, {muteHttpExceptions: true}).getContentText();
var regex = /(edge_hashtag_to_media":{"count":)(\d+)(,"page_info":)/gm;
var count = regex.exec(response)[2];
Logger.log(count);
}


演示-

Instagram Hashtag count

我添加了 muteHttpExceptions: true,但我的评论中未添加。希望这可以帮助。

关于xpath - Scrape Instagram Web Hashtag帖子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58063800/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com