gpt4 book ai didi

web-scraping - 从链接创建摘要

转载 作者:行者123 更新时间:2023-12-04 04:23:02 26 4
gpt4 key购买 nike

许多页面(facebook、google+ 等)都有一个功能,可以创建带有标题、图像和来自链接的一些文本的摘要。我试图找出是否有任何关于如何执行此类功能的库或指南,但我的搜索结果根本没有帮助。

我知道我可以解析页面的 html 并提取我想要的元素,但我认为应该有某种标准来说明如何做到这一点(也许还有如何创建对这种功能友好的页面。

任何有良好链接的人都会为我指明正确的方向? Javascript 或 .Net 是我的首选,但我也可以自己实现。

最佳答案

对于“也许还有如何创建对这种功能友好的页面”。部分:
您可能正在搜索 open graph protocol :

<html xmlns:og="http://ogp.me/ns#">
<head>
<title>The Rock (1996)</title>
<meta property="og:title" content="The Rock" />
<meta property="og:type" content="movie" />
<meta property="og:url" content="http://www.imdb.com/title/tt0117500/" />
<meta property="og:image" content="http://ia.media-imdb.com/images/rock.jpg" />
...
</head>
...
</html>

我认为这是 facebook 会首先看到的地方。但是当这些标签丢失时,facebook 似乎有自己的算法来检测页面中最相关的部分。

关于web-scraping - 从链接创建摘要,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7187217/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com