gpt4 book ai didi

c# - 使用 ITextSharp 获取 PDF 中图像的位置(X、Y、宽度、高度)

转载 作者:太空宇宙 更新时间:2023-11-03 12:08:18 26 4
gpt4 key购买 nike

我有一个问题是:绘制一个矩形以覆盖 PDF 中的所有图像。我已经知道图像可以写成图像,但也可以写成图形向量。

我想获取普通图像(例如保存为位图)的位置(X、Y、宽度、高度),并在其上绘制矩形,以免覆盖页面上的其他元素,例如该图像下的文本(我不想覆盖整个页面,如果图像仅覆盖页面的 30%)。到目前为止,我已经编写了两个用于获取图像的函数:

  public List<Image> GetImagesFromPdf(string path)
{
List<Image> imageList = new List<Image>();
PdfReader reader = new PdfReader(path);
for (int i=1;i<reader.NumberOfPages;i++)
{
PdfDictionary pdfDict = reader.GetPageN(i);
imageList.AddRange(GetImagesFromDocument(pdfDict, reader));
}
return imageList;
}

private List<Image> GetImagesFromDocument(PdfDictionary dict, PdfReader doc)
{
List<Image> imageList = new List<Image>();
PdfDictionary resources = (PdfReader.GetPdfObject(dict.Get(PdfName.RESOURCES))) as PdfDictionary;
PdfDictionary objects = (PdfReader.GetPdfObject(resources.Get(PdfName.XOBJECT))) as PdfDictionary;
if (objects != null)
{
foreach (PdfName objKey in objects.Keys)
{
PdfObject obj = objects.Get(objKey);
if (obj.IsIndirect())
{
PdfDictionary tg = (PdfDictionary)(PdfReader.GetPdfObject(obj));
PdfName objectType = (PdfName)(PdfReader.GetPdfObject(tg.Get(PdfName.SUBTYPE)));
if (
PdfName.IMAGE.Equals(objectType)
||PdfName.IMAGEB.Equals(objectType)
|| PdfName.IMAGEC.Equals(objectType)
|| PdfName.IMAGEI.Equals(objectType)
)
{
int xrefIdx = ((PRIndirectReference)obj).Number;
PdfObject pdfObj = doc.GetPdfObject(xrefIdx);
PdfStream str = (PdfStream)(pdfObj);

iTextSharp.text.pdf.parser.PdfImageObject pdfImage =
new iTextSharp.text.pdf.parser.PdfImageObject((PRStream)str);
System.Drawing.Image img = pdfImage.GetDrawingImage();

imageList.Add(img);
}
else if (PdfName.FORM.Equals(objectType) || PdfName.GROUP.Equals(objectType))
{
imageList.AddRange(GetImagesFromDocument(tg, doc));
}
}
}
}
return imageList;
}

我正在调用函数 GetImagesFromPdf,然后为每个页面运行函数:GetImagesFromDocument。这导致 pdf 中的图像数量正确,但我真的不知道如何获取位置(X、Y、宽度、高度)....我还可以使用什么吗?或者我应该为此使用另一种机制?

任何帮助将不胜感激。附言。我注意到一件事……我还尝试实现 IExtRenderListener 接口(interface),我注意到当 pdf 中有图像时,函数 RenderImage 被调用。有一个函数可以调用对象 renderInfo,结果很有趣,我得到了那个值(该函数称为 GetImageCTM()):

The function is called GetImageCTM()

当我试图覆盖以图形矢量形式编写的图像时,我失败了。没有图像被覆盖,但我得到了大约 15000 个非常小的矩形,不幸的是没有一个是可见的。我使用了这段代码:

  public void ModifyPath(PathConstructionRenderInfo renderInfo)
{
if (renderInfo.Operation == PathConstructionRenderInfo.RECT)
{
float x = renderInfo.SegmentData[0];
float y = renderInfo.SegmentData[1];
float w = renderInfo.SegmentData[2];
float h = renderInfo.SegmentData[3];
Vector a = new Vector(x, y, 1).Cross(renderInfo.Ctm);
Vector b = new Vector(x + w, y, 1).Cross(renderInfo.Ctm);
Vector c = new Vector(x + w, y + h, 1).Cross(renderInfo.Ctm);
Vector d = new Vector(x, y + h, 1).Cross(renderInfo.Ctm);

Rectangle rect = new Rectangle(x,y,x+w, y+h); //is that correct ?
}
else
{
for (int i = 0; i < renderInfo.SegmentData.Count - 1; i += 2)
{
float x = renderInfo.SegmentData[i];
float y = renderInfo.SegmentData[i + 1];
Vector a = new Vector(x, y, 1).Cross(renderInfo.Ctm);
// Rectangle rect = new Rectangle(x, y, x + ..., y + ...); What to do here ?
}
}
modifyPathCounter++;
}

好的,已经解决了,解决方案在这里:

 if (renderInfo.Operation == PathConstructionRenderInfo.RECT)
{
float x = renderInfo.SegmentData[0];
float y = renderInfo.SegmentData[1];
float w = renderInfo.SegmentData[2];
float h = renderInfo.SegmentData[3];
Vector a = new Vector(x, y, 1).Cross(renderInfo.Ctm);
Vector b = new Vector(x + w, y, 1).Cross(renderInfo.Ctm);
Vector c = new Vector(x + w, y + h, 1).Cross(renderInfo.Ctm);
Vector d = new Vector(x, y + h, 1).Cross(renderInfo.Ctm);

Rectangle rect = new Rectangle(a[0],a[1],c[0], c[1]);
//SquaresToDraw image = new SquaresToDraw(0, rect.Left, rect.Bottom, rect.Right, rect.Top);
// squaresToDraw.Add(image);
}
else
{
if (renderInfo.SegmentData!=null)
{
for (int i = 0; i < renderInfo.SegmentData.Count - 1; i += 2)
{
float x = renderInfo.SegmentData[i];
float y = renderInfo.SegmentData[i + 1];
Vector a = new Vector(x, y, 1).Cross(renderInfo.Ctm);
Rectangle rect = new Rectangle(x, y, a[0], a[1]);
SquaresToDraw image = new SquaresToDraw(0, rect.Left, rect.Bottom, rect.Right, rect.Top);
squaresToDraw.Add(image);
// Rectangle rect = new Rectangle(x, y, x + ..., y + ...); What to do here ?
}
}

}

最佳答案

您的两种方法为您提供了与您的页面相关联的资源(直接或间接),但仅此而已,它们无法告诉您在页面上的何处(或根本没有)使用此类资源。所以这不会产生任何东西。

但是您的 IExtRenderListener 方法确实是您要走的路。您的观察是正确的,ImageCtm 是表示应用于原始图像的仿射变换与原点处的 1x1 正方形相比的矩阵。

只需将该变换应用于 1x1 单位正方形的角,即可获得页面上图像的角。

关于c# - 使用 ITextSharp 获取 PDF 中图像的位置(X、Y、宽度、高度),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53783701/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com