- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想从 PDF 中提取图像。我现在正在使用 iTextSharp。有些图像可以正确提取,但大多数图像颜色不正确并且失真。我用不同的 PixelFormats 做了一些实验,但我没有得到解决我的问题的方法......
这是区分图像类型的代码:
if (filter == "/FlateDecode")
{
// ...
int w = int.Parse(width);
int h = int.Parse(height);
int bpp = tg.GetAsNumber(PdfName.BITSPERCOMPONENT).IntValue;
byte[] rawBytes = PdfReader.GetStreamBytesRaw((PRStream)tg);
byte[] decodedBytes = PdfReader.FlateDecode(rawBytes);
byte[] streamBytes = PdfReader.DecodePredictor(decodedBytes, tg.GetAsDict(PdfName.DECODEPARMS));
PixelFormat[] pixFormats = new PixelFormat[23] {
PixelFormat.Format24bppRgb,
// ... all Pixel Formats
};
for (int i = 0; i < pixFormats.Length; i++)
{
Program.ToPixelFormat(w, h, pixFormats[i], streamBytes, bpp, images));
}
}
这是将图像保存在 MemoryStream 中的代码。将图片保存在文件夹中,稍后实现。
private static void ToPixelFormat(int width, int height, PixelFormat pixelformat, byte[] bytes, int bpp, IList<Image> images)
{
Bitmap bmp = new Bitmap(width, height, pixelformat);
BitmapData bmd = bmp.LockBits(new Rectangle(0, 0, width, height),
ImageLockMode.WriteOnly, pixelformat);
Marshal.Copy(bytes, 0, bmd.Scan0, bytes.Length);
bmp.UnlockBits(bmd);
using (var ms = new MemoryStream())
{
bmp.Save(ms, System.Drawing.Imaging.ImageFormat.Tiff);
bytes = ms.GetBuffer();
}
images.Add(bmp);
}
请帮帮我。
最佳答案
即使您找到了问题的解决方案,让我说一下修复上面代码的建议。
我认为失真问题是由于行数据边界不匹配造成的。 PdfReader 以字节边界返回数据。例如,对于 20 像素宽的灰度图像,每个图像行将获得 20 个字节的数据。位图类适用于 32 位边界。当创建宽度为 20 像素的位图时,Bitmap 类将生成步幅(字节宽度)=32 字节的灰度位图。这意味着您不能像在 ToPixelFormat() 中那样使用 Marshal.Copy() 方法简单地将检索到的字节从 PdfReader 复制到新位图中。
源字节数组中的第一个像素位于第 21 个字节,但由于位图的 32 位边界,目标位图需要它作为第 33 个字节。为了解决这个问题,我必须创建字节数组,其大小要考虑每个数据行的 32 位边界。
从 PdfReader 检索的字节数组逐行复制数据到新的字节数组,考虑 32 位行边界。现在我有了边界与 Bitmap 类边界匹配的数据字节,因此我可以使用 Marshal.Copy() 将其复制到新的 Bitmap。
关于c# - 使用 iTextSharp 提取 FlateDecode 图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10029789/
我使用以下代码来解码 pdf 中的文本流。在某些情况下,流需要由 2 个过滤器解码。 <> 我首先通过 ASCII85Decode 解码流,然后使用 Flatedecode。在某些情况下,flated
我正在为工作编写一个 PDF 解析器,我们正在使用 Core Graphics 通过回调读取所有数据,然后使用 Lib Haru 将其写出,因为我们的客户需要写出“真实”注释和 CG做不到。 好吧,我
使用 peepdf我正在分析两个简单的 pdf 文件。这两个文件都包含一行文本(“ZYXWVUTSRQQRSTUVWXYZ”)并且是在 Mac OS X 上创建的。 第一个文件是用 TextEdit
我在IText中对PDF的平面解码流进行了编码,不幸的是我有一个干净的文本,但无法准确说出它的含义......在PDF 32000中没有关于这个主题的文档...还有关于这个问题的其他文档吗? 示例 q
我想从 PDF 中提取图像。我现在正在使用 iTextSharp。有些图像可以正确提取,但大多数图像颜色不正确并且失真。我用不同的 PixelFormats 做了一些实验,但我没有得到解决我的问题的方
当通过 iTextSharp 将 PDF 中的图像解码为 FlateDecode 时,图像失真,我似乎无法弄清楚原因。 识别的 bpp 是 Format1bppIndexed。如果我将 PixelFo
我发布了一个与此相关的问题 a while back但没有得到回应。从那时起,我发现 PDF 是使用 FlateDecode 编码的,我想知道是否有办法在 C# (Windows Phone 8) 中
我正在尝试从 pdf 中提取图像。图像是过滤器“FlateDecode”。我得到了图像,但它只是一条黑色路径。我是这方面的新手,请帮助我。代码是: int width = xObject.Elemen
如何使用 PDFSharp 从 PDF 文档中提取经过 FlateDecoded(例如 PNG)的图像? 我在 PDFSharp 示例中发现了该评论: // TODO: You can put the
我正在尝试使用以下代码解压 PDF 格式的数据 import re import zlib pdf = open("some_doc.pdf", "rb").read() stream = re.co
我无法像这样从流中解密数据: 56 0 obj > stream x]êΩnƒ Ñ{ûbÀKq¬æ\âê¢....(whole binary is omitted)
我是一名优秀的程序员,十分优秀!