- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我发布了一个与此相关的问题 a while back但没有得到回应。从那时起,我发现 PDF 是使用 FlateDecode 编码的,我想知道是否有办法在 C# (Windows Phone 8) 中手动解码 PDF?我得到如下输出:
%PDF-1.5
%????
1 0 obj
<<
/Type /Catalog
/Pages 2 0 R
>>
endobj
5 0 obj
<<
/Filter /FlateDecode
/Length 9
>>
stream x^+
PDF 是使用 Windows Phone 8 的 SyncFusion PDF 控件创建的。不幸的是,它们目前没有文本提取功能,我在其他 WP PDF 控件中也找不到该功能。
基本上,我只想从 OneDrive 下载 PDF 并阅读 PDF 内容。想知道这是否容易实现?
最佳答案
private static string decompress(byte[] input)
{
byte[] cutinput = new byte[input.Length - 2];
Array.Copy(input, 2, cutinput, 0, cutinput.Length);
var stream = new MemoryStream();
using (var compressStream = new MemoryStream(cutinput))
using (var decompressor = new DeflateStream(compressStream, CompressionMode.Decompress))
decompressor.CopyTo(stream);
return Encoding.Default.GetString(stream.ToArray());
}
根据下面类似的问题,必须从流中删除流的前 2 个字节。这是在上面的函数中完成的。只需将流的所有字节传递给输入即可。确保字节数与指定的长度相同。
关于c# - 有没有一种简单的方法可以手动解码 FlateDecode 过滤器以提取 PDF 中的文本? C#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25798538/
我使用以下代码来解码 pdf 中的文本流。在某些情况下,流需要由 2 个过滤器解码。 <> 我首先通过 ASCII85Decode 解码流,然后使用 Flatedecode。在某些情况下,flated
我正在为工作编写一个 PDF 解析器,我们正在使用 Core Graphics 通过回调读取所有数据,然后使用 Lib Haru 将其写出,因为我们的客户需要写出“真实”注释和 CG做不到。 好吧,我
使用 peepdf我正在分析两个简单的 pdf 文件。这两个文件都包含一行文本(“ZYXWVUTSRQQRSTUVWXYZ”)并且是在 Mac OS X 上创建的。 第一个文件是用 TextEdit
我在IText中对PDF的平面解码流进行了编码,不幸的是我有一个干净的文本,但无法准确说出它的含义......在PDF 32000中没有关于这个主题的文档...还有关于这个问题的其他文档吗? 示例 q
我想从 PDF 中提取图像。我现在正在使用 iTextSharp。有些图像可以正确提取,但大多数图像颜色不正确并且失真。我用不同的 PixelFormats 做了一些实验,但我没有得到解决我的问题的方
当通过 iTextSharp 将 PDF 中的图像解码为 FlateDecode 时,图像失真,我似乎无法弄清楚原因。 识别的 bpp 是 Format1bppIndexed。如果我将 PixelFo
我发布了一个与此相关的问题 a while back但没有得到回应。从那时起,我发现 PDF 是使用 FlateDecode 编码的,我想知道是否有办法在 C# (Windows Phone 8) 中
我正在尝试从 pdf 中提取图像。图像是过滤器“FlateDecode”。我得到了图像,但它只是一条黑色路径。我是这方面的新手,请帮助我。代码是: int width = xObject.Elemen
如何使用 PDFSharp 从 PDF 文档中提取经过 FlateDecoded(例如 PNG)的图像? 我在 PDFSharp 示例中发现了该评论: // TODO: You can put the
我正在尝试使用以下代码解压 PDF 格式的数据 import re import zlib pdf = open("some_doc.pdf", "rb").read() stream = re.co
我无法像这样从流中解密数据: 56 0 obj > stream x]êΩnƒ Ñ{ûbÀKq¬æ\âê¢....(whole binary is omitted)
我是一名优秀的程序员,十分优秀!