gpt4 book ai didi

php - PHP-获取数据包长度

转载 作者:可可西里 更新时间:2023-10-31 22:42:45 33 4
gpt4 key购买 nike

我目前正在处理PHP中的套接字和数据包,并且不知道从哪里开始获取数据包的长度。我从GitHub存储库尝试了此操作(不记得是哪个):

    private function get_packet_length($socket) {
$a = 0;
$b = 0;
while(true) {
$c = socket_read($socket, 1);
if (!$c) {
return 0;
}
$c = ord($c);
$a |= ($c & 0x7F) << $b++ * 7;
if ($b > 5) {
return false;
}
if (($c & 0x80) != 128) {
break;
}
}
return $a;
}

有人知道为什么这行不通吗?我得到 int(1)

编辑
private function get_packet_length($socket) {
$a = 0;
$b = 0;
while(true) {
$c = socket_read($socket, 10240);
if (!$c) {
return 0;
}
$c = ord($c);
$a .= strlen($c);
if ($b > 5) {
return false;
}
if (($c & 0x80) != 128) {
break;
}
}
return $a;
}

输出: string(2) "01"

最佳答案

数据包没有固有的长度,即使从C获取此信息实际上也相对困难。这是因为在用户层,套接字数据没有以数据包的形式表示。 (UDP表示为完整的有效载荷,但是在用户区中接收到的单个UDP有效载荷绝对有可能仍然代表多个数据包。)因此,这个问题并不是很正确,您真正应该问的是如何确定如何在套接字上可以读取许多字节。

那么,为什么您粘贴的代码没有告诉您呢?您应该真正理解该代码的作用,因为它很有趣。但是,由于它与您实际上可能感兴趣的信息有关,因此我将其留待以后使用。

不幸的是,PHP没有为您提供一种使用原始套接字FD调用ioctl(2)的方法。这将允许您在PHP-land中执行类似ioctl(sock, FIONREAD, &n)的操作来确定可读取的字节数。 (实际上,显然,如果您使用fopenfsockopen,则可以执行此操作,但是我想您没有。)las,这行不通。

幸运的是,有两个选项供您选择:

  • 使用非阻塞套接字。您可以在套接字流上调用socket_set_nonblock。完成此操作后,对socket_readsocket_write等的任何调用都将在非阻塞模式下进行。这意味着如果您这样做$data = socket_read($socket, 1024),并且少于1024个字节可用,将返回可用字节。 (如果没有可用数据,则返回的字节数可能为0。)
  • 使用socket_select对一系列套接字执行相同的操作。此函数通知您哪些套接字具有可读数据/处于可写状态/具有需要处理的错误。

  • 无论使用哪种版本,处理套接字未接收到足够数据的情况的一般方法都是实现超时。 socket_select为此提供了一个 native 接口(interface);使用非阻塞套接字手动执行此操作需要您记住已等待了多长时间,并在调用 socket_read之间实现了 sleep 。如果您在一段时间(例如10秒)内未收到足够的数据,请关闭套接字,然后再进行处理。

    如果收到的数据超出预期,那是一个错误,然后关闭套接字,然后将其遗忘。

    您正在处理的协议(protocol)也很重要。因为您还没有说要处理什么协议(protocol),所以我无法借助指针来告诉您期望有多少数据。但是也许您正在实现自己的协议(protocol)很有趣。

    在这种情况下,您需要确定对在线数据进行编码的方法。因为您说的问题中使用的方法具有一些二进制技巧,所以我将做同样的事情。您可能需要将32位值 pack放入字符串的开头。收到连接后,您等待前4个字节进入。一旦读取了这4个字节,就可以 unpack该数据来确定需要读取多少字节。

    <?php
    $payload = "Have a nice day!\n";
    $len = strlen($payload) + 1; // + 1 for terminating NUL byte
    $packet = pack("Na", $len, $payload);
    socket_send($sock, $packet, $len + 4); // + 4 is length
    ...

    然后,在服务器上
    <?php
    $r = socket_read($sock, 4);
    $la = unpack("N", $r);

    // Because we don't know how much to read until we get the first 4 bytes.
    // Obviously this is a DoS vector for someone to hold the connection open,
    // so you will likely want to use socket_select to get that first bit of
    // data. That's an exercise for you.
    socket_set_nonblock($sock);
    $len = $la[1];
    $time = 0;
    $payload = "";
    while ($len > 0 && $time < 10) {
    $data = socket_read($sock, $la[1]);
    $tlen = strlen($data);
    $payload .= $data;
    $len -= $tlen;
    if ($len == 0) {
    break;
    }
    sleep(1); // Feel free to usleep.
    $time++;
    }

    N.B.我在确保正确编码打包/解压缩数据后没有测试此代码,因此不确定是否可以逐字使用它。将其视为体系结构伪代码。

    其他协议(protocol)具有其他长度编码方式。例如,在通常情况下,HTTP使用Content-Length。

    您的示例代码

    在先前的编辑中,我只是通过查看第一个字节来获取长度来解决这个问题。我回过头来回答这个问题,因为我看到了反对意见,并且关于数据包的某些措辞困扰着我。我也从快速浏览该代码中就得出结论,这是非常错误的。

    该代码从套接字读取各个字节,以尝试获取可变长度的剩余有效负载。 (我想知道这是来自ZeroMQ的 repo 代码还是Apple推送通知之类的代码。)无论如何,看起来该代码确实有些奇怪的东西,但是实际上是什么呢?
    private function get_packet_length($socket) {
    $a = 0;
    $b = 0;
    while(true) {
    /* Read next single byte off of the socket */
    $c = socket_read($socket, 1);
    if (!$c) {
    return 0;
    }

    /* Use integer value of the byte instead of the character value */
    $c = ord($c);

    /*
    * Get the first 7 bits of $c. Since $c represents an integer value
    * of a single byte, its maximum range is [0, 2^8). When we use only
    * 7 bits, the range is constrained to [0, 2^7), or 0 - 127. This
    * means we are using the 8th bit as a flag of some kind -- more on
    * this momentarily.
    *
    * The next bit executed is ($b++ * 7), since multiplication has
    * higher precedence than a left shift. On the first iteration, we
    * shift by 0 bits, the second we shift 7 bits, the third we shift
    * 14 bits, etc. This means that we're incrementally building an
    * integer value byte by byte. We'll take a look at how this works
    * out on real byte sequences in a sec.
    */
    $a |= ($c & 0x7F) << $b++ * 7;

    /*
    * If we've tried to handle more than 5 bytes, this encoding doesn't
    * make sense.
    */
    if ($b > 5) {
    return false;
    }

    /*
    * If the top bit was 1, then we still have more bytes to read to
    * represent this number. Otherwise, we are done reading this
    * number.
    */
    if (($c & 0x80) != 128) {
    break;
    }
    }
    return $a;
    }

    因此,让我们考虑一下几个不同的字节流的含义:
    $stream = "\x01"; /* This is pretty obviously 1 */
    $stream = "\x81\x80\x80\x00";
    /* This is also 1, can you figure out why? */

    $stream = "\xff\x01"; /* You might think it 256, but this is 255 */
    $stream = "\x80\x82"; /* This is 256. */
    $stream = "\xff\xff\x01"; /* 32767 */
    $stream = "\x80\x80\x02"; /* 32768 */

    $stream = "\x0c\x00\x48\x65\x6c\x6c\x6f\x2c\x20\x77\x6f\x72\x6c\x64\x21"
    /*
    * A static value 13, a length terminator, and 13 bytes that happen
    * to represent "Hello, world!".
    * This shows how such an encoding would be used in practice
    */

    如果您熟悉字节顺序,则可能会注意到这些值是以Little-endian编码传输的。这通常很奇怪(网络字节顺序为big-endian),但实际上并没有发送完整的整数值:我们正在发送可变长度的字节流。每个字节的编码可以帮助我们弄清楚长度是多少。但是,在不知道该代码实现什么协议(protocol)的情况下,这实际上可能是一个错误,导致该代码无法在具有不同字节序的计算机之间移植。

    重要的是要注意,这是字节流协议(protocol)的一部分,而不是获取任何长度的标准方法。实际上,许多二进制协议(protocol)并未定义为字节流协议(protocol)。这是因为字节流协议(protocol)通常根本不定义字节序(因为该字节流不需要)。因此,如果您在PPC或某些ARM处理器上运行此代码,它将无法正常工作。因此,我们说此代码不可移植。

    在处理字节流或通过网络发送原始二进制数据时,请始终确保定义数据的字节序。如果您不这样做,则您的协议(protocol)将创建不可移植的实现。另请参见Rob Pike的 this great post,以获取有关字节顺序的更多信息,以及为什么在任何时候遇到问题时,您要么感到困惑,要么某人做错了事(例如,在未完全定义数字编码的情况下定义字节流协议(protocol))。

    关于php - PHP-获取数据包长度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27631009/

    33 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com