gpt4 book ai didi

php - 检查链接时会添加下划线

转载 作者:行者123 更新时间:2023-12-04 04:43:19 25 4
gpt4 key购买 nike

我正在制作一个简单的链接检查器来检查我现在管理的站点中文件的数千个直接链接。所有文件都来自archive_org。我做了一个文本区域

<table width="100%"> <tr><td>URLs to check:</td><td><textarea name="myurl" id="myurl" cols="100" rows="20"></textarea></td></tr> 
<tr><td align="center" colspan="2"><br/><input class="text" type="submit" name="submitBtn" value="Check links"></td></tr> </table>

并且其上的所有链接都将存储在一个名为 $url 的数组中(每个 url 都放在一个新行中)
$url = explode("\n", $_POST['myurl']);

我使用 print_r 打印它,数组内的链接与未添加任何字符的输入相同。

我使用两种方法检查了 url:fopen() 和 curl 函数,无论我放了多少个链接,程序都会看到除了最后一个链接之外的所有链接都被破坏了。数组中的最后一个链接是唯一被正确检查的链接。

我使用了 get_headers 函数,我注意到所有链接(除了最后一个)的末尾都添加了下划线 (_)。 get_headers 代码是:
for ($i=0;$i<count($url);$i++) {
$headers = @get_headers($url[$i]);
$headers = (is_array($headers)) ? implode( "\n ", $headers) : $headers;
print_r($headers);
echo "<br /><br />";
}

在标题中,我注意到链接是这样的:

HTTP/1.0 302 Moved Temporarily Server: nginx/1.1.19 Date: Mon, 02 Sep 2013 10:46:40 GMT Content-Type: text/html; charset=UTF-8 X-Powered-By: PHP/5.3.10-1ubuntu3.2 Accept-Ranges: bytes Location: http://ia600308.us.archive[dot]org/23/items/historyofthedecl00731gut/1dfre012103.mp3_ X-Cache: MISS from Dataprolinks X-Cache: MISS from AIMAN-DPL X-Cache-Lookup: MISS from AIMAN-DPL:3128 Connection: close HTTP/1.0 404 Not Found Server: nginx/1.1.19 Date: Mon, 02 Sep 2013 10:46:41 GMT Content-Type: text/html; charset=UTF-8 X-Powered-By: PHP/5.3.10-1ubuntu3.2 Set-Cookie: PHPSESSID=s2j3ct95vdji0ua89f32grd984; path=/; domain=.archive.org Expires: Thu, 19 Nov 1981 08:52:00 GMT Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0 Pragma: no-cache X-Cache: MISS from Dataprolinks X-Cache: MISS from AIMAN-DPL X-Cache-Lookup: MISS from AIMAN-DPL:3128 Connection: close



链接加了下划线,除了最后一个url的header,没有加下划线。我猜这个下划线是造成检查错误的原因。

我在哪里犯错?

最佳答案

对于您的情况,我猜您在 Window 中发布 URL,当您按 时“输入”分隔链接的键, “输入” "\r\n" .在 WWW 中,不得包含 "\r" ,因此某处(php?curl?我不知道。)将其转换为 "_" .

<?php

$urls = array();
$urls[] = 'http://archive.org/download/historyofthedecl00731gut/1dfre011103.mp3';
$urls[] = 'http://archive.org/download/historyofthedecl00731gut/1dfre000103.txt';
$urls[] = 'http://archive.org/download/historyofthedecl00731gut/1dfre082103.mp3';
$urls[] = 'http://archive.org/download/historyofthedecl00731gut/1dfre001103.txt';
$urls[] = 'http://archive.org/download/historyofthedecl00731gut/1dfre141103.mp3';

print("<pre>" .print_r($urls, 1). "</pre><br /><br />");

foreach($urls as $url){
//ensure each url only start with ONE _ and end with ONE _
print("<pre>_" . $url . "_</pre>");
$header = array();
$headers = @get_headers($url);
print("<pre>" .print_r($headers, 1). "</pre><br /><br />");
}

?>

你可以用我的代码做一个简单的测试:每个链接都会打印 "_"无论是开始还是结束。然后证明我的解释。如何修复:只需添加 strip_tags(nl2br($url))删除 "\r" , "\n" .

Simple result

关于php - 检查链接时会添加下划线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18571260/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com