- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
背景
我在 Docker 镜像中运行的快速应用程序中使用 Puppeteer。我们有必要在 Docker 中运行,因为 Debian 需要我们无法安装的依赖项。使用 Docker 可以让我们安装我们需要的东西。
我们已经看到很多人在让他们的字体在 PDF 中正确呈现时遇到问题,在我见过的每种情况下,以接近于此的方式安装字体始终是答案,
apt-get install -yq --allow-unauthenticated ttf-mscorefonts-installer
在那种情况下,他们正在安装恰好有一个 apt-get
的特定字体。我看到其他人也使用 RUN apt-get install -yyq fonts-liberation
安装默认的 Puppeteer 字体。
代码示例
const browser = await puppeteer.launch({
args: ['--no-sandbox', '--disable-setuid-sandbox'],
ignoreHTTPSErrors: true,
dumpio: false,
});
const page = await browser.newPage();
await page.goto(
`http://localhost:3000/${template}?data=${JSON.stringify(req.body)}`,
);
const pdfBuffer = await page.pdf({
format: 'A4',
margin: {
top: '20px',
left: '20px',
right: '20px',
bottom: '20px',
},
});
await browser.close();
问题
我们需要安装大约 10 种字体,应用程序的不同部分将在不同场合使用。为此,我们有 ttf
和 woff
文件。我们决定将它们添加到系统中,就像 apt-get
对我们看到人们安装的其他字体所做的那样。我们通过将我们的字体添加到 Debian 目录来做到这一点,
/usr/local/share/fonts
我们可以通过运行看到系统中的字体设置正确,
fc-list
当我们像这样添加字体时,它们不会呈现。相反,我们在这些字体应该出现的地方得到了奇怪的符号。
示例
我们正在使用 Dockerfile 添加我们的字体,
RUN apt-get install -yyq fonts-liberation
COPY /fonts/*.ttf /usr/local/share/fonts/
COPY /fonts/*.woff /usr/local/share/fonts/
问题
由于我们有一堆 ttf
和 woff
字体文件需要使用 Puppeteer 在 PDF 中呈现,将它们添加到我们的 Debian 镜像的正确方法是什么在 Docker 中运行以便 Puppeteer 将按预期使用它们?
最佳答案
这是一个示例脚本,用于捕获网站上的屏幕截图和 pdf。两者在这个问题上的目的相同,以显示字体有效。
(async()=>{
const puppeteer = require('puppeteer')
const browser = await puppeteer.launch({
headless: true,
args: ["--no-sandbox", "--disable-setuid-sandbox"]
});
const page = await browser.newPage()
await page.goto('https://jp.quora.com/')
await page.screenshot({path: `/shared/_${Date.now()}.png`})
const pdfBuffer = await page.pdf({path: `/shared/_${Date.now()}.pdf`});
await browser.close()
})()
这是最小的 dockerfile,这是非常小的,它不包含任何额外的东西,比如 dumb-init 和各种清理黑客,因为这里不需要。
FROM node:8
# Install dependencies
RUN apt-get update && \
apt-get -yq install libatk1.0-0 libgtk2.0-0 libnotify-dev libgconf-2-4 libnss3 libxss1 libasound2 libxtst6 libasound2 xauth xvfb
# Cd into /app
WORKDIR /app
# Copy package.json into app folder
COPY package.json /app
# Install dependencies
RUN npm install
COPY . /app
# Start script on Xvfb
CMD ["xvfb-run","npm","start"]
运行时,这是日语 Quora 在 puppeteer 上的显示方式,它是这样显示的,因为缺少字体。
因为它是基于 jessie 的,我们可以使用几个不同的命令来安装字体。
下面会安装一些日文字体。
RUN apt-get -yq install xfonts-utils fonts-droid xfonts-intl-asian
如果我在 fonts 目录中有字体,那么命令是,
COPY fonts/*.* /usr/share/fonts/truetype/
这真的很简单。但是字体仍然无法工作,因为字体缓存的更新速度不够快。添加以下内容将确保它已更新。
RUN mkfontscale && mkfontdir && fc-cache
就是这样!让我们再次运行脚本。
关于node.js - 将字体添加到 Puppeteer PDF 渲染器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51033223/
我的代码有一些问题。我正在尝试遍历包含许多 PDF 的 Drive 文件夹,然后将它们合并为一个文件。当我使用我的代码时,它只是为 Drive 文件夹中的最后一个 PDF 创建一个 PDF,而不是按预
我从 PDF Specification 获取了 PDF 规范中的最小 PDF 示例。 ,将其复制到记事本,将文件重命名为扩展名为 .pdf。 我可以用其他 PDF 查看器(PDF-XChange、S
感谢您在以下方面的帮助: 我有 2 个部分可访问的 PDF(包含标签),我想使用一些命令行工具(如 PDFtk 或 Ghostscript,或任何 Perl 模块)将它们连接起来: 我已经尝试使用 P
我想使用 ghostscript 将矢量 pdf 转换为光栅 pdf(即光栅化矢量 pdf)。但是即使我添加了解析参数 -r300,我也找不到合适的参数来执行此操作。 我使用的代码是-dSAFER -
我无法在 FAQ 中找到这个功能是否存在于 API 中,尽管它在书中提到作为潜在可用的东西。有没有人有任何实现此功能的经验? 最佳答案 在 This thread (日期为 2007 年 6 月)Pa
我要放文件sample.pdf在我的网站上,并希望使用 pdf.js 显示它.我想要的是显示我自己的文件,如 demo ,带有工具栏,放大/缩小等。到目前为止,我还不能这样做。 我确实检查了 hell
我知道这可能不是严格意义上的编程问题(也许是,我不知道)但我在尝试转换常规 pdf(带有超链接、书签、图像、嵌入字体等)时遇到了严重问题.) 转换为 PDF/A-1 格式。 当我用 pdfaPilot
这是 PDF.js 网站 https://github.com/mozilla/pdf.js 我正在搜索和阅读很多文章,大多数编码都是将 pdf 导入 pdf.js 并在浏览器上显示,我不明白是不是
谁能建议我如何将扫描图像转换为可搜索图像或如何将扫描 pdf 转换为可搜索 pdf? 很长一段时间以来,我一直陷入这种情况。 我已经在 ubuntu 中尝试过 pdfocr 应用程序,但没有成功。 最
作为我对客户端/服务器 pdf 签名研究的一部分,我测试了 itext pdf 延迟签名示例。不幸的是,我生成的 pdf 即合并空签名 pdf 和哈希值的输出显示无效签名。 我的代码片段如下 cla
我想将一个 PDF 页面插入到另一个已缩放的 PDF 页面中。我想使用 iTextSharp 来实现此目的。 我有一个矢量绘图,可以导出为单页 PDF 文件。我想将此文件添加到其他 PDF 文档的页面
作为我对客户端/服务器 pdf 签名研究的一部分,我测试了 itext pdf 延迟签名示例。不幸的是,我生成的 pdf 即合并空签名 pdf 和哈希值的输出显示无效签名。 我的代码片段如下 cla
我想为 Kindle 转换电子书。我尝试使用 Calibre 将具有复杂格式样式和图像的基于两种语言的基于文本的大型 PDF 电子书转换为适用于 Kindle 的 AZW3 电子书,并且还尝试了亚马逊
我在 Google Chrome 中显示 pdf 时遇到问题。问题是 Chrome 将 pdf 的某些页面显示为黑色。 启用 Chrome PDF 查看器时会发生这种情况。如果我禁用此插件并使用 Ad
我确信这个问题无处不在,尽管我似乎找不到答案。我希望我的 PDF 文档在 PDF 阅读器中显示时没有空白页,但随后在封面后打印空白页,这样打印出来的文档在右侧甚至左侧都有奇数页。还有其他人遇到过这个问
我需要自动裁剪 pdf 文件(去除白边)。到目前为止,我尝试了两种并不完美的工具: pdf裁剪 问题:它不会裁剪某些 pdf。 pdf-crop-margins 问题:有时它裁剪得太多(精细的细节)。
This PDF由几个源文件组成。其中五个是包含 alpha channel 的 PNG。一种是没有 alpha channel 的 PNG。最后一 block 是带有透明效果的 Photoshop
我的团队将内部 wiki 页面用于各种内容。这些页面是使用 MediaWiki 创建的。我想知道是否有任何方法可以将 wiki 页面转换为 PDF 格式。我必须用它来将用户文档转换为 PDF 格式,以
我希望能够从我可能在数据库或 xml 或任何其他结构化形式中拥有的数据生成高度图形化(也包含大量文本内容)的 PDF 文件。 目前,我们的平面设计师在将内容作为 MS Word 文档后,在 Photo
我正在寻找可以帮助我找到重复 PDF 的实用程序。问题:我有 1000 个 PDF 文件。有些是重复的。由于不同的文件名和文件大小的微小差异,它们不容易被检测到。是否有实用程序/算法/库可以帮助我找到
我是一名优秀的程序员,十分优秀!