html - 使用 w3m 转储 html 源代码会产生意想不到的字符/符号-6ren

html - 使用 w3m 转储 html 源代码会产生意想不到的字符/符号

转载作者：搜寻专家更新时间：2023-10-31 23:20:31

26

4

作为 w3m 的新用户，我正在尝试做一些基本的事情，例如:

w3m -dump_source nytimes.com > nytimes.html

产生的输出给出了疯狂的字符和符号。但是，当我使用 w3m nytimes 浏览时，它会正确加载，我什至可以使用 v 查看 HTML。

进一步尝试:

w3m -dump_extra nytimes.com > nytimes.html

除了 HTML 源代码之外，我完美地获得了与网站相关的所有额外信息。

如有任何帮助，我们将不胜感激。

最佳答案

默认情况下，w3m 通过发送以下 HTTP header 从服务器请求压缩输出:

Accept-Encoding: gzip, compress, bzip, bzip2, deflate

header 的值可能会因 w3m 的版本而异，但事实是最新版本的程序使用 compressed 从主机请求输出 Accept-Encoding header 。您可以使用以下命令找出确切的 header :

w3m -dump_source -reqlog nytimes.com > /dev/null

请求和响应 header 将记录到 ~/.w3m/request.log 文件中。

您可以通过覆盖 header 来请求未压缩版本，如下所示:

w3m -dump_source nytimes.com -o accept_encoding='identity;q=0'

甚至

w3m -dump_source nytimes.com -o accept_encoding='*;q=0'

或者，通过管道解压缩输出:

w3m -dump_source nytimes.com | gunzip -f

如果输入数据不是gunzip 可识别的格式，-f 选项会导致 gunzip 复制输入数据而不更改标准输出。根据文档，您还应该传递 --stdout 选项，但即使没有此选项，管道命令也应该将结果打印到标准输出。

请注意，服务器可能会响应以 bzip2 压缩的内容。在这种情况下，您可以通过 bunzip2 -f 命令通过管道输出。

关于html - 使用 w3m 转储 html 源代码会产生意想不到的字符/符号，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41787966/

26

4

0

文章推荐： node.js - 如何从 express 重定向到 react-router？

文章推荐： php - Symfony - 将值从一种形式传递到另一种形式

Haskell (a -> m a) -> m (a -> a) -> m (a -> a)
在过去的几个月里，我一直在研究 Haskell，我遇到了一个我不太确定如何处理的单子(monad)的情况。我有一个 a -> m a 类型的值第二个类型为 m (a -> a)我需要对它们进行组合，
Haskell - 是否有扩展的 monad 类型 [ m (a -> m b) -> m a -> m b ]
仿函数有 (a -> b) -> m a -> m b 应用程序有 f (a -> b) -> f a -> f b Monad 有 m a -> (a -> m b) -> m b 但是，是否有扩展
haskell - 单子(monad) m => a -> [a -> m a] -> m a
我是 Haskell 的新手，我想知道是否有比 Hoogle 更好的方法来确定一个库功能是否重复？举个例子:我有很多函数f :: Monad a => a -> m a我想链接在一起，比如 f123
arrays - 将列表的 (m,m,n) 数组组合成一个 (m,m,n) 数组
将存储在一系列列表中的 m、m、n 维数组组合成一个 m、m、n 维数组的方法是什么？示例: 这是三个包含 m,m,n 维数组的列表: list1 <- array (1, dim = c(5, 5
haskell - 编写函数 (a -> b -> ... -> t) -> (Monad m => m a -> m b -> ... -> m t)
有没有办法写一个函数f::(a -> b -> ... -> t) -> (Monad m => m a -> m b -> ... -> m t )，基本上是 liftMn 对于任何 n？ (编辑:
python - 如何将 m×m 数据帧转换为 pandas 中的 m*m×3 数据帧？
我有一个像这样的 pandas 数据框: df = pd.DataFrame({'A':[1,3,2,9],'B':[2,1,2,7],'C':[7,2,4,6],'D':[8,1,6,4]},ind
haskell - 如何定义签名为 h::M Int -> M Int -> M Int 的函数，以便 h (M x) (M y) = M (x+y) 而不解开 monad？
这个问题来自文章“Trivial Monad”，地址:http://blog.sigfpe.com/2007/04/trivial-monad.html 。提供的答案是 h x y = x >>= (
haskell - haskell中有 `m a -> (a -> m b) -> m a`函数类型吗？
所以>>= :: m a -> (a -> m b) -> m b和>> :: m a -> m b -> m b . 而 f b -> f a . 但我想要一些能m a -> (a -> m b)
algorithm - 写成[(m + n)^m]/m有效吗!作为 O([n/m]^m) 作为其宽松的上限？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 3 年前。 Improve
raku - 什么是 nqp、nqp-m、rakudo-debug、rakudo-debug-m、rakudo-gdb-m、rakudo-m、rakudo-valgrind-m？
当我安装 rakudo来源: $ git clone git@github.com:rakudo/rakudo.git $ cd rakudo $ perl Configure.pl --gen-mo
proof - 在 Idris 中证明如果 n = m 且 m = o，则 n + m = m + o？
我正在尝试通过查看一些练习来提高我的 Idris 技能 Software Foundations (最初是为 Coq 设计的，但我希望对 Idris 的翻译不会太糟糕)。我在使用 "Exercise:
javascript - 你能加密1(m)、加密2(E1(m)、解密1(E2(E1(m))) 和解密2(E2(m)) 吗？
我想知道以下是否可行。与服务器交换密码时，应保护密码。因此，用户可以使用生成的 key kUser 来加密密码。 Encrypt(m, kUser) 生成加密消息 eU(m)。现在用户将此信息发送到
SQL:这两个表之间存在什么样的关系(1:1、1:m、m:m、...)？
这两个表之间存在什么样的关系(1:1、1:m、m:m，等等)？ CREATE TABLE IF NOT EXISTS `my_product` ( `id` int(11) NOT NULL au
haskell - foldMap::(Monoid m) => (a -> m) -> f a -> m 类型是什么意思以及如何实现它？
有人可以解释类型的含义以及如何实现吗？ class Foldable f where foldMap :: (Monoid m) => (a -> m) -> f a -> m 基于 https:
c# - c# 如何找出 "m"来自 (m => m.SomeProperty)？
例如，在 MVC 应用程序中，我可以使用 Html 助手来创建这样的标签: @Html.LabelFor(m => m.ProductName) 我没有在任何地方声明变量“m”，但 IDE 会自动找出
operator-overloading - C++11 重载 `M operator+(M&&,M&&)`
更新:澄清、更明确的重点和缩短的示例: 我可以避免 M op+(M&&,M&&) 过载吗？假设，我想很好地处理 RValues？我想其他三个重载是必需的。我首先使用 (&&,&&) 重载的原因: 通
r - 对 n*m 矩阵的所有列组合进行函数运算，生成 m*m 结果
假设我有一个函数，它接受两个向量并返回一个整数，例如一个向量中也存在另一个向量中的元素数量。喜欢: f m [,1] [,2] [,3] [1,] "c" "i" "c" [2,] "
python 正则表达式子％H :%M:%S to %M:%s or 01:%M:%s
我想将字符串(字幕)转换为: 585 00:59:59,237 --> 01:00:01,105 - It's all right. - He saw us! 586 01:00:01,139 -->
algorithm - 如何计算(1+a%m+a^2%m……+a^n%m)的总和
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用，以及预
linux - 转换 d.m.Y h :m:s to Y-d-m h:m:s for a large file in linux
是否可以将 Linux 中的大文件将 d.m.Y h:m:s 转换为 Y-d-m h:m:s？示例数据 "30.07.2016 00:00:00",DN123,PAPN,PAPN,TEST,9189

首页

博学

6Ren·AI

商城

html - 使用 w3m 转储 html 源代码会产生意想不到的字符/符号