- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
语言 -> C++11 或 C++98 {NOT C}
操作系统 -> Linux嵌入式系统
限制-> 禁止使用任何第 3 方库。概述 -> 与网站建立连接。
我有一个 Linux 嵌入式系统,不允许下载任何库,如 poco 或 libcurl 或 boost 来建立与网站的连接和提取信息。所以我想知道是否有人可以指导我如何完全通过 C++ [不是 c] 中的原始套接字建立连接并从页面检索信息。
解析信息并检索准确信息对我来说不是挑战,我的主要问题是如何通过 http 协议(protocol)建立连接。如果我是对的,要连接到网站我需要 http 协议(protocol)而不是 TCP/IP。
有人可以给我指出正确的方向吗?谢谢
最佳答案
您可以使用原始 TCP socket
与 HTTP
通信。由于您没有提供代码,我也无法提供代码。如果您已经知道如何连接、发送和接收来自服务器的数据,那应该很容易。只需按照以下步骤操作。假设您要连接到 www.cnn.com
。
1。将网站的域名转换为 IP 地址。
2。使用端口 80 连接到该 IP 地址。
3。发送字符串 GET/HTTP/1.1\r\nHost: www.cnn.com\r\nConnection: close\r\n\r\n
4。从套接字/服务器读取。如果服务器可用,它将响应该网页上的页面或 html 代码。
5。关闭套接字连接。
请注意,如果您不提供您正在使用的 User-Agent
/Web 浏览器 名称,某些网站将不会响应,甚至会阻止您。
要解决此问题,请在添加步骤中将 User-Agent:MyBrowserName\r\n
header 添加到字符串中。你可以伪造浏览器。您必须在每个 header 之后放置 \r\n
。
例如,我使用的 Chrome 浏览器是 Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36(KHTML,如 Gecko)Chrome/48.0.2564.97 Safari/537.36。 p>
将在步骤 3 中发送的新字符串应如下所示 GET/HTTP/1.1\r\nHost: www.cnn.com\r\nConnection: close\r\nUser-Agent: Mozilla/5.0(Windows NT 10.0;WOW64)AppleWebKit/537.36(KHTML,如 Gecko)Chrome/48.0.2564.97 Safari/537.36\r\n\r\n
。您应该注意到每个标题后都有 \r\n
。最后一个 header 以 \r\n\r\n
而不是 \r\n
结尾。
其他有用的 header 是 Connection: Keep-Alive\r\n
, Accept-Language: en-us\r\n
, Accept-Encoding: gzip,放气\r\n
,
如果网站是 https
而不是 http
,请将端口 80 替换为 443。事情从这里开始变得复杂,因为您必须实现 SSL
协议(protocol)。
假设您想访问另一个目录中的页面而不是主页,并且 url 是 http://www.cnn.com/2016/05/13/health/healthy-eating-quiz/index.html
要发送的字符串应该是这样的:
GET/2016/05/13/health/healthy-eating-quiz/index.html HTTP/1.1\r\n主机:www.cnn.com\r\n连接:关闭\r\n\r\n
如果您使用代理,则必须将整个 url 放在 GET
命令之后:
GET GET http://www.cnn.com/2016/05/13/health/healthy-eating-quiz/index.html HTTP/1.1\r\n主机:www.cnn.com\r\n连接:关闭\r\n\r\n
关于c++ - 纯粹通过原始套接字连接连接到网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37231114/
当需要将原始类型转换为字符串时,例如传递给需要字符串的方法时,基本上有两种选择。 以int为例,给出: int i; 我们可以执行以下操作之一: someStringMethod(Integer.to
我有一个位置估计数据库,并且想要计算每月的内核利用率分布。我可以使用 R 中的 adehabitat 包来完成此操作,但我想使用引导数据库中的样本来估计这些值的 95% 置信区间。今天我一直在尝试引导
我希望使用 FTP 编写大型机作业流。为此,我可以通过 FTP 连接到大型机并运行以下命令: QUOTE TYPE E QUOTE SITE FILETYPE=JES PUT myjob.jcl 那么
我是 WPF 的新手。 目前,我正在为名为“LabeledTextbox”的表单元素制作一个用户控件,其中包含一个标签、一个文本框和一个用于错误消息的文本 block 。 当使用代码添加错误消息时,我
我们正在使用 SignalR(原始版本,而不是 Core 版本)并注意到一些无法解释的行为。我们的情况如下: 我们有一个通过 GenericCommand() 方法接受命令的集线器(见下文)。 这些命
使用 requests module 时,有没有办法打印原始 HTTP 请求? 我不只想要标题,我想要请求行、标题和内容打印输出。是否可以看到最终由 HTTP 请求构造的内容? 最佳答案 Since
与直接访问现有本地磁盘或分区的物理磁盘相比,虚拟磁盘为文件存储提供更好的可移植性和效率。VMware有三种不同的磁盘类型:原始磁盘、厚磁盘和精简磁盘,它们各自分配不同的存储空间。 VMware
我有一个用一些颜色着色器等创建的门。 前段时间我拖着门,它问我该怎么办时,我选择了变体。但现在我决定选择创建原始预制件和门颜色,或者着色器变成粉红色。 这是资源中原始预制件和变体的屏幕截图。 粉红色的
我想呈现原始翻译,所以我决定在 Twig 模板中使用“原始”选项。但它不起作用。例子: {{ form_label(form.sfGuardUserProfile.roules_acceptance)
是否可以在sqlite中制作类似的东西? FOREIGN KEY(TypeCode, 'ARawValue', IdServeur) REFERENCES OTHERTABLE(TypeCode, T
这个问题是一个更具体问题的一般版本 asked here .但是,这些答案无法使用。 问题: geoIP数据的原始来源是什么? 许多网站会告诉我我的 IP 在哪里,但它们似乎都在使用来自不到 5 家公
对于Openshift:如何基于Wildfly创建docker镜像? 这是使用的Dockerfile: FROM openshift/wildfly-101-centos7 # Install exa
结果是 127 double middle = 255 / 2 虽然这产生了 127.5 Double middle = 255 / 2 同时这也会产生 127.5 double middle = (
在此处下载带有已编译可执行文件的源代码(大小:161 KB(165,230 字节)):http://www.eyeClaxton.com/download/delphi/ColorSwap.zip 原
以下几行是我需要在 lua 中使用的任意正则表达式。 ['\";=] !^(?:(?:[a-z]{3,10}\s+(?:\w{3,7}?://[\w\-\./]*(?::\d+)?)?/[^?#]*(
这个问题是一个更具体问题的一般版本 asked here .但是,这些答案无法使用。 问题: geoIP数据的原始来源是什么? 许多网站会告诉我我的 IP 在哪里,但它们似乎都在使用来自不到 5 家公
我正在使用GoLang做服务器api,试图管理和回答所发出的请求。使用net/http和github.com/gorilla/mux。 收到请求时,我使用以下结构创建响应: type Response
tl; dr:我认为我的 static_vector 有未定义的行为,但我找不到它。 这个问题是在 Microsoft Visual C++ 17 上。我有这个简单且未完成的 static_vecto
我试图找到原始 Awk (a/k/a One True Awk) 源代码的“历史”版本。我找到了 Kernighan's occasionally-updated site ,它似乎总是链接到最新版本
我在 python 中使用原始 IPv6 套接字时遇到一些问题。我通过以下方式连接: if self._socket != None: # Close out old sock
我是一名优秀的程序员,十分优秀!