python - 使用 Python 捕获 TCP 数据包-6ren

python - 使用 Python 捕获 TCP 数据包

转载作者：行者123 更新时间：2023-11-28 18:53:57

27

4

我尝试使用 dpkt 和 pcap 使用 Python 捕获 HTTP 下载。代码看起来像

...
pc = pcap.pcap(iface)
for ts, pkt in pc:
    handle_packet(pkt)

def handle_packet(pkt):
    eth = dpkt.ethernet.Ethernet(pkt)

    # Ignore non-IP and non-TCP packets
    if eth.type != dpkt.ethernet.ETH_TYPE_IP:
        return
    ip = eth.data
    if ip.p != dpkt.ip.IP_PROTO_TCP:
        return

    tcp = ip.data
    data = tcp.data

    # current connection
    c = (ip.src, ip.dst, tcp.sport, tcp.dport)

    # Handle only new HTTP-responses and TCP-packets
    # of existing connections.
    if c in conn:
        handle_tcp_packet(c, tcp)
    elif data[:4] == 'HTTP':
        handle_http_response(c, tcp)
...

在 handle_http_response() 和 handle_tcp_packet() 中，我读取了 tcp 数据包的数据 (tcp.data) 并将它们写入一份文件。但是我注意到我经常收到具有相同 TCP 序列号 (tcp.seq) 的数据包(在同一连接上)，但它们似乎包含相同的数据。此外，似乎并非所有数据包都被捕获。例如，如果我对数据包大小求和，则结果值低于 http header (content-length) 中列出的值。但是在 Wireshark 中我可以看到所有包。

有谁知道为什么我会收到那些重复的数据包以及如何捕获属于 http-response 的每个数据包？

编辑:
您可以在这里找到完整的代码:pastebin.com .运行时它会向标准输出打印类似的内容:

Waiting for HTTP-Audio-responses ...
...
New TCP-Packet, len=1440, tcp-payload=5107680, con-len=5197150 , dups=57 , dup-bytes=82080
New TCP-Packet, len=1440, tcp-payload=5109120, con-len=5197150 , dups=57 , dup-bytes=82080
New TCP-Packet, len=1440, tcp-payload=5110560, con-len=5197150 , dups=57 , dup-bytes=82080
----------> FIN <----------
New TCP-Packet, len=1937, tcp-payload=5112497, con-len=5197150 , dups=57 , dup-bytes=82080
New TCP-Packet, len=0, tcp-payload=5112497, con-len=5197150 , dups=57 , dup-bytes=82080

如您所见，TCP 负载加上重复接收的字节 (5112497+82080=5194577) 小于下载的文件大小 (5197150)。此外，您可以看到我收到了 57 个重复的包(相同的 SEQ 和相同的 TCP 数据)，并且在带有 FIN 标志的包之后仍然收到了包。

那么有没有人知道我如何捕获属于该连接的所有数据包？ Wireshark 可以看到所有数据包，我认为它也使用 libpcap。

我什至不知道是我做错了什么还是 pcap 库做错了什么。

编辑 2:
好的，看来我的代码是正确的:在 Wireshark 中，我保存了捕获的数据包并在我的代码中使用了捕获文件(pcap.pcap('/home/path/filename') 而不是 pcap.pcap('eth0'))。我的代码完美地读取了所有包(在多次测试中)!由于 Wireshark 也使用 libpcap (afaik)，我认为问题是 lib pypcap 没有为我提供所有包。

关于如何测试它有什么想法吗？

我已经自己编译了 pypcap(主干)，但这并没有改变任何东西-.-

编辑 3:
好的，我更改了我的代码以使用 pcapy 而不是 pypcap，但遇到了同样的问题:
从之前捕获的文件(使用 Wireshark 创建)读取数据包时一切正常，但是当我直接从 eth0 捕获数据包时，我错过了一些数据包。

有趣:当并行运行两个程序(一个使用 pypcap 和一个使用 pcapy)时，它们捕获不同的数据包。例如一个程序多接收一个数据包。

但我仍然不知道为什么-.-
我认为 Wireshark 使用相同的 base-lib (libpcap)。

请帮忙:)

最佳答案

需要注意以下几点:

确保你有一个大的 snaplen - 对于 pcapy 你可以在 open_live 上设置它(第二个参数)
确保你处理碎片化的数据包——这不会自动完成——你需要检查细节
检查统计数据 - 不幸的是，我认为这不会暴露给 pcapy 接口(interface)，但您可能没有处理所有数据包；如果你来不及了，你将不知道你错过了什么(尽管你可以通过跟踪 tcp 流的长度/位置获得相同的信息)libpcap 本身确实公开了这些统计数据，所以你可以为它添加函数

关于python - 使用 Python 捕获 TCP 数据包，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7155050/

27

4

0

文章推荐： javascript - 如何提高 Canvas 中线条的分辨率

文章推荐： python - 使用 Apache + mod_wsgi 的 Web 内容过滤器？

文章推荐： css - 如何以这种特定方式平铺背景图像？

文章推荐： javascript - http请求的串行执行

python - 解码十六进制(？)数据包
使用 Python 的 rtmplib 绑定(bind)并遇到一些问题。首先，我有这样的东西: import librtmp conn = librtmp.RTMP(...) conn.con
HTTP 数据包，发生了什么？
基本上，我是在查看 Motorstorm 排行榜时在 PS3 上窃听数据包。排行榜以 XML 格式发送到我的 ps3，但只有在我获得授权后。那么有人可以告诉我这三个数据包之间发生了什么，以及我如何在浏
握手后的 TCP 数据包
我正在努力了解 TCP，但解析大量 RFC 并没有帮助。我相信我了解连接和关闭握手，但我似乎无法找到任何总结实际数据流的内容。在连接和关闭握手之间 TCP 数据包看起来像什么？ (特别是标题) 最佳
Android::TCP 数据包
我正在尝试通过 RCON 端口与我的 Minecraft 服务器通信。虽然我不知道如何使用套接字和流的东西。四处寻找，我发现他们都有一些共同点。套接字、输入流和输出流。我在我的代码中试过了，但返回
networking - 过滤意外发送到我的端口的 UDP 数据包
我正在 UDP 之上设计一个简单的协议(protocol)，现在我意识到其他人可以将数据包发送到我正在监听的端口。这样的数据包对于我的应用程序来说显然是不正确的(我现在不担心安全问题) 是否有过滤这些
networking - 游戏服务器应该如何以定义的滴答率接收 udp 数据包？
我目前有一个具有可自定义滴答率的游戏服务器，但在本示例中，我们建议服务器每秒仅滴答一次或 1hz。我想知道如果客户端发送速率比服务器快，因为我当前的设置似乎不起作用，那么处理传入数据包的最佳方法是什么
c# - 以正确的字节顺序发送 UDP 数据包
我无法理解网络字节顺序以及通过 UDP 发送和接收数据的顺序。我正在使用 C#。我有一个结构保持: message.start_id = 0x7777CCCC; message.me
usb - USB 主机何时在控制读取传输结束时需要零长度的 IN 数据包？
我正在为 USB 设备编写代码。假设 USB 主机开始控制读取传输以从设备读取一些数据，并且请求的数据量(设置数据包中的 wLength)是端点 0 最大数据包大小的倍数。那么在主机接收到所有数据后(
Wireshark 数据包 'Data' 格式
我有一台 Windows PC、Marvell 交换机、Netgear 交换机和一台 Ubuntu 机器连接在一起(通过 Netgear 交换机)。我最近从 Windows PC 向 Marvell
sockets - 识别 DNS 数据包
在查看数据包字节码时，您将如何识别 dns 数据包。 IP header 的协议(protocol)字段会告诉后面有一个 UDP 帧，但是在 UDP 帧内没有协议(protocol)字段来指定接下来会
c# - 重组分片的 UDP 数据包
我有一个通过 udf 的 802.11 (wifi) 上各种类型的流量的 pcap。由于 MTU，udp(或更准确地说是 IP)对 wifi 数据包进行分段。我目前正在使用 SharpPcap 读取并
macos - 什么是 'k' 数据包？
我正在开发的 Core Audio 应用程序上有此崩溃日志。我目前正在调试它，所以我的问题不是关于崩溃本身，而是关于的含义“k”包 . 这是什么意思？我已阅读 this , 和 this (关于
sockets - 仅在混杂模式下接收的 UDP 数据包
我在一台 VM Ubuntu 16.04 机器上的 100 个多播组上生成 UDP 数据包，并在另一台 VM Ubuntu 16.04 机器上订阅这些组。两者都在由 Hyper-V 管理器运行的 HP
java - 为什么我的简单应用程序没有收到 UDP 数据包
这个问题在这里已经有了答案: How can I fix 'android.os.NetworkOnMainThreadException'? (66 个回答) 6年前关闭。我正在尝试创建一个简单的
java - 创建原始数据包以欺骗 UDP 数据包
我正在寻找使用 Java 来欺骗 UDP 数据包。是否有任何好的 Java 库可以让您创建自己的 RAW SOCKETS？最佳答案我会使用包装 libpcap 的 Java API . libpc
websocket - 无法读取我的 websocket 数据包
我在基于 Tyrus 的客户端和 tomcat Web 服务器之间使用没有压缩的 websocket。我在 tomcat 端看到消息传入和传出我的套接字，但如果我设置一个wireshark来观察它们传
java - 模拟器中未从本地主机收到 UDP 数据包
我的应用程序在模拟器中运行时无法接收 UDP 数据包。 UDP 数据包由“localhost”上的以下 java 程序通过端口 49999 发送。 DatagramSocket clien
java - 需要一种可中断的方式来监听工作线程中的 UDP 数据包
我正在开发一个 Google Glass 应用程序，它需要在工作线程中监听 UDP 数据包(与发送 UDP 数据包的现有系统集成)。我之前发布了一个问题(请参阅 here )并收到了一个答案，其中提供
java - 服务器未正确读取发送的 UDP 数据包
我正在从客户端向服务器发送两个数据包。我遇到的问题是，在服务器上读取的数据使两个字符串对于发送的最长字符串具有相同的长度。例如: 如果字符串 1 为:1234 字符串 2 为:abcdefghi 服务
java - 在同一类中发送和接收 UDP 数据包
我知道这是不好的做法，但是可以执行以下操作吗？ Send packet1 to UDP port 1 port 1 receives packet1 and sends it to port 2 po

首页

博学

6Ren·AI

商城

python - 使用 Python 捕获 TCP 数据包