gpt4 book ai didi

c# - iTextSharp System.OutOfMemoryException 异常

转载 作者:行者123 更新时间:2023-11-30 16:02:57 25 4
gpt4 key购买 nike

我在尝试创建大型 PDF 文件时遇到问题。基本上我有一个字节数组列表,每个数组都包含一个字节数组形式的 PDF。我想将字节数组合并成一个 PDF。这适用于较小的文件(2000 页以下),但当我尝试创建一个 12,00 页的文件时,它被轰炸了)。最初我使用的是 MemoryStream,但经过一些研究,一个常见的解决方案是改用 FileStream。所以我尝试了一种文件流方法,但得到了类似的结果。该列表包含 3,800 条记录,每条包含 4 页。 MemoryStream 在大约 570 条记录后爆炸。FileStream 在大约 680 条记录后。代码崩溃后的当前文件大小为 60MB。我究竟做错了什么?这是我的代码,代码在“copy.AddPage(curPg);”上崩溃指令,在“for(”循环内。

    private byte[] MergePDFs(List<byte[]> PDFs)
{
iTextSharp.text.Document doc = new iTextSharp.text.Document();
byte[] completePDF;
Guid uniqueId = Guid.NewGuid();
string tempFileName = Server.MapPath("~/" + uniqueId.ToString() + ".pdf");

//using (MemoryStream ms = new MemoryStream())
using(FileStream ms = new FileStream(tempFileName, FileMode.Create, FileAccess.Write, FileShare.Read))
{
iTextSharp.text.pdf.PdfCopy copy = new iTextSharp.text.pdf.PdfCopy(doc, ms);
doc.Open();

int i = 0;
foreach (byte[] PDF in PDFs)
{
i++;
// Create a reader
iTextSharp.text.pdf.PdfReader reader = new iTextSharp.text.pdf.PdfReader(PDF);

// Cycle through all the pages
for (int currentPageNumber = 1; currentPageNumber <= reader.NumberOfPages; ++currentPageNumber)
{
// Read a page
iTextSharp.text.pdf.PdfImportedPage curPg = copy.GetImportedPage(reader, currentPageNumber);

// Add the page over to the rest of them
copy.AddPage(curPg);
}

// Close the reader
reader.Close();
}

// Close the document
doc.Close();

// Close the copier
copy.Close();

// Convert the memorystream to a byte array
//completePDF = ms.ToArray();
}

//return completePDF;
return GetPDFsByteArray(tempFileName);
}

最佳答案

一些注意事项:

  1. PdfCopy 实现了 iDisposable,所以您应该尝试看看 using 是否有帮助。
  2. PdfCopy.FreeReader() 会有所帮助。

无论如何,不​​确定您使用的是 MVC 还是 WebForms,但这是一个简单的工作 HTTP handler使用在我的工作站上运行的 15 页 125KB 测试文件进行测试:

<%@ WebHandler Language="C#" Class="MergeFiles" %>
using System;
using System.Collections.Generic;
using System.Web;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;

public class MergeFiles : IHttpHandler
{
public void ProcessRequest(HttpContext context)
{
List<byte[]> pdfs = new List<byte[]>();
var pdf = File.ReadAllBytes(context.Server.MapPath("~/app_data/test.pdf"));
for (int i = 0; i < 4000; ++i) pdfs.Add(pdf);

var Response = context.Response;
Response.ContentType = "application/pdf";
Response.AddHeader(
"content-disposition",
"attachment; filename=MergeLotsOfPdfs.pdf"
);
Response.BinaryWrite(MergeLotsOfPdfs(pdfs));
}

byte[] MergeLotsOfPdfs(List<byte[]> pdfs)
{
using (var ms = new MemoryStream())
{
using (Document document = new Document())
{
using (PdfCopy copy = new PdfCopy(document, ms))
{
document.Open();
for (int i = 0; i < pdfs.Count; ++i)
{
using (PdfReader reader = new PdfReader(
new RandomAccessFileOrArray(pdfs[i]), null))
{
copy.AddDocument(reader);
copy.FreeReader(reader);
}
}
}
}
return ms.ToArray();
}
}

public bool IsReusable { get { return false; } }
}

试图使输出文件类似于您在问题中描述的内容,但 YMMV,具体取决于您处理的单个 PDF 的大小。这是我运行的测试输出:

enter image description here

关于c# - iTextSharp System.OutOfMemoryException 异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37056340/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com