gpt4 book ai didi

linq - Anglesharp - 如何从 Yelp 网站获得评分和评论?

转载 作者:行者123 更新时间:2023-12-03 18:35:31 28 4
gpt4 key购买 nike

我想试试我的手和网页抓取。我注意到 Anglesharp 非常适合 .Net 环境。我正在尝试从 yelp 站点获取所有描述和评级的列表,但我没有收到任何错误或任何结果。这是 html 外观的一个子集(在“https://www.yelp.ca/biz/walmart-toronto-12”中更详细):

<div class="rating-very-large">
<i class="star-img stars_2" title="2.0 star rating">
<img alt="2.0 star rating" class="offscreen" height="303" src="//s3-media4.fl.yelpcdn.com/assets/srv0/yelp_styleguide/c2252a4cd43e/assets/img/stars/stars_map.png" width="84">
</i>
<meta itemprop="ratingValue" content="2.0">
</div>
<p itemprop="description" lang="en">This Walmart still terrifies me<br><br>Baby things can be found on the back right of the lower level. Godspeed.</p>

<div class="rating-very-large">
<i class="star-img stars_1" title="1.0 star rating">
<img alt="1.0 star rating" class="offscreen" height="303" src="//s3-media4.fl.yelpcdn.com/assets/srv0/yelp_styleguide/c2252a4cd43e/assets/img/stars/stars_map.png" width="84">
</i>
<meta itemprop="ratingValue" content="1.0">
</div>
<p itemprop="description" lang="en">Wow I don&#39;t even know where to begin, </p>

这是我的查询:
var config = var config = new Configuration().WithJavaScript().WithCss();
var parser = new HtmlParser(config);
var document = await BrowsingContext.New(config).OpenAsync("https://www.yelp.ca/biz/walmart-toronto-12");

//Do something with LINQ
var descriptionListItemsLinq = document.All.Where(m => m.LocalName == "p" && m.Id.Contains("description"));
foreach (var element in descriptionListItemsLinq)
{
element.Text().Dump();
}

如何获得用户评论(描述)和评级的列表?

最佳答案

我查了 HTML来源https://www.yelp.ca/biz/walmart-toronto-12 .正如我所料,用户评论在 JSON格式。你不应该使用 AngleSharp在这种情况下。

下面的照片摘自HTML来源。

enter image description here

这是 JSON 的解析版本:

enter image description here

这是一个 JSON你可以用 Newtonsoft.Json 反序列化它.只需提取 JSON并从中阅读您需要的内容。

关于linq - Anglesharp - 如何从 Yelp 网站获得评分和评论?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39707735/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com