gpt4 book ai didi

php - 如何使用 PHP 从 HTML 文件中获取元数据?

转载 作者:可可西里 更新时间:2023-11-01 01:06:28 24 4
gpt4 key购买 nike

我正在尝试在我的网站上创建一个用户可以上传链接的功能,例如 Digg。我有代码从用户上传到我网站的 URL 中获取 HTML 源代码,并将其存储在 .txt 文件中。然后我想抓取标签中的内容

<meta name="content" description="GRAB THIS"> 

假设这个标签存在。有时它有效,但有时它不起作用,即使该特定网页的源代码包含与我在代码中指定的完全相同的必要元标记。我注意到如果“GRAB THIS”内容包含 html 实体(& 等),它似乎无法正常工作。如果您对如何让它发挥作用有任何想法,请告诉我。这是我的代码:

$html_data = file_get_contents( $path_to_txt_file_that_contains_html );
preg_match( '#<meta name="description" content="(.+?)">#si', $html_data, $tor;
$tor = str_replace ( '<meta name="description" content="' , "", $tor[0] );
$tor = str_replace ( '">', "", $tor );

有时 $tor 仍然包含

<meta name="description" content="CONTENT"

但没有关闭 >,所以一旦我将其放入 mySQl 数据库中,我的代码就会中断。关于我做错了什么的任何想法?提前感谢您的帮助!

最佳答案

其实非常简单。

PHP 提供了它自己的内置解决方案:http://php.net/manual/en/function.get-meta-tags.php

关于php - 如何使用 PHP 从 HTML 文件中获取元数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9756207/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com