gpt4 book ai didi

c# - Process.StandardOutput Read 方法返回空(有时)

转载 作者:太空宇宙 更新时间:2023-11-03 14:59:57 33 4
gpt4 key购买 nike

我正在使用 wkhtmltopdf从 HTML 字符串生成 PDF 文件。代码大致如下:

// ...
processStartInfo.UseShellExecute = false;
processStartInfo.CreateNoWindow = true;
processStartInfo.RedirectStandardInput = true;
processStartInfo.RedirectStandardOutput = true;
processStartInfo.RedirectStandardError = true;

// ...
process = Process.Start(processStartInfo);
using (StreamWriter stramWriter = process.StandardInput)
{
stramWriter.AutoFlush = true;
stramWriter.Write(htmlCode);
}

byte[] buffer = new byte[32768], file;
using (var memoryStream = new MemoryStream())
{
while (true)
{
int read = process.StandardOutput.BaseStream.Read(buffer, 0, buffer.Length);
if (read <= 0)
break;
memoryStream.Write(buffer, 0, read);
}
file = memoryStream.ToArray();
}

process.WaitForExit(60000);
process.Close();

return file;

这按预期工作,但对于一段特定的 HTML,StandardOutput.BaseStream.Read 方法的第一次调用返回一个空字节数组,在这种情况下 StandardOutput.EndOfStream 也是如此。

我通常会怀疑 wkhtmltopdf 工具出于任何原因无法处理 HTML 输入,但问题是这种情况只发生在五分之二的尝试中,所以我现在怀疑这可能与进程缓冲有关并输出流读取。但是,我似乎无法找出确切的问题是什么。

什么会导致这种行为?

更新

读取 StandardError 是显而易见的方法,但没有帮助,它始终是一个空字符串。 process.ExitCode (-1073741819) 也没有,据我所知,它只是声明“进程崩溃”。

最佳答案

经过将近一年的生产使用,wkhtmltopdf正在做它的工作,到目前为止,上述问题报告的次数不超过五次。

当在文档末尾某处添加一个 DIV 时,问题通常会消失,其高度值足以使最后一行文本移动到下一页(比如 20px),如果页面恰好是满的。

我们知道该工具有时无法将 HTML 内容正确拆分为页面,因为在这种情况下,它生成(比如说)七页,而页码仅报告六页;所以最后一页的页码是“7 of 6”。我们认为,也许它有时会完全失败并且根本无法生成页面。该文档是从高度动态的 HTML 内容生成的。在不使用虚拟 DIV 的情况下进行导致更短/更长内容的更改相对容易,这就是我们如何克服到目前为止的错误。

现在我们正在测试 puppeteer .

关于c# - Process.StandardOutput Read 方法返回空(有时),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46707977/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com