文档在线预览总结篇-6ren

文档在线预览总结篇

转载作者：我是一只小鸟更新时间：2023-07-04 22:34:21

26

4

@ 。

实现方式1、由后端统一将文档转成图片，再返回给前端进行展示
实现方式2、由后端统一将文档转成html，再返回给前端进行展示
实现方式3、由后端统一将文档转成pdf，再返回给前端进行展示
实现方式4、纯前端实现在线预览
实现方式5、服务器安装组件实现在线预览
- 1、kkfileview
- 2、OnlyOffice
- 3、office online server
- 4、Libre Office Online（不推荐）
- 5、Collabora Online
总结

最近因为工作需求，调研了实现文档在线预览功能的方式，总结了一下，大概的实现方式由后端统一转成图片或者pdf或者html返回前端，再由前端进行展示。还有就是前端根据不同文件类型使用对应的在线预览组件进行在线预览。因为每种实现方式的内容都比较多，限于篇幅，所以之前拆成了三篇文章进行说明：
文档在线预览（一）通过将txt、word、pdf转成图片实现在线预览功能

文档在线预览（二）word、pdf文件转html以实现文档在线预览。

文档在线预览（三）使用js前端实现word、excel、pdf、ppt 在线预览。

文档在线预览（四）将word、txt、ppt、excel、图片转成pdf来实现在线预览。

文档在线预览（五）在服务器部署组件来实现在线预览。

因为拆成了多篇文章，内容比较分散，所以本文将对这几种方式进行进行一个总结，阐述每种实现方式的大致流程，以及比较一下每种实现方式的优缺点.

实现方式1、由后端统一将文档转成图片，再返回给前端进行展示

这方式是由后端通过aspose-words（用于txt、word转图片），pdfbox（用于pdf转图片）、Graphics2D （用于excel等文件转图片）等组件将文档统一转换成图片，再返回给前端进行展示。详细的实现可以参考这篇文章：《文档在线预览（一）通过将txt、word、pdf转成图片实现在线预览功能》。

这种方式的优点是:

1、图片在线预览控件比较多，也比较成熟，前端起来比较方便。

2、文档转成图片后能有效减少文档内容被复制的情况。

3、浏览器也天然支持。

这种方式的缺点是:

1、文档往往都不只一页，所有同城的做法将文档的每一页都生成一张图片，所以前后端都需要考虑处理多张图片的问题（可以考虑把图片都放到一个html或者pdf里）。

2、如果图片都以base64的格式返回给前端，会造成返回体过大的问题，如果返回有加日志还会存在日志体较长，增加日志服务器的问题.

3、因为base64的格式直接返回返回体过长，好一点的做法现将图片上传到图片服务器，只返回图片的url，这样解决了图片返回体过长的问题，但要先将多张图片先上传到图片服务器，这样会不可避免的拖慢接口的返回速度，尤其是在文档页数较多的时候，同时也会增加图片服务器的压力.

实现方式2、由后端统一将文档转成html，再返回给前端进行展示

这种方式是由后端通过aspose-words（用于word转html），pdfbox（用于pdf转html）等组件将文档统一转换成html，再返回给前端进行展示。注意这种方式往往都存在一个问题，一般再将文档转换成html代码，往往都是追求目标是通过使用文档中的语义信息并忽略其他细节来生成简单干净的 HTML，所以在转换过程中复杂样式被忽略，比如居中、首行缩进、字体，文本大小，颜色。举个例子在转换是会将应用标题 1 样式的任何段落转换为 h1 元素，而不是尝试完全复制标题的样式。所以转成html的显示效果往往和原文档不太一样。这意味着对于较复杂的文档而言，这种转换不太可能是完美的。但如果都是只使用简单样式文档或者对文档样式不太关心的这种方式也不妨一试.

这种方式的优点是:

1、前端处理比较方便。

2、浏览器天然支持。

这种方式的缺点是:

1、转换后样式可能和原文件存在些许的区别。

实现方式3、由后端统一将文档转成pdf，再返回给前端进行展示

这方式是由后端通过aspose-words（用于txt、word转pdf），itextpdf（用于excel转pdf）或者spire.office.free（用于excel转pdf）等组件将文档统一转换成pdf文件，再返回给前端进行展示。将 txt、word、excel、ppt、图片等文件转成pdf文件详细的实现方式可以参考这篇文章：文档在线预览（三）将word、txt、ppt、excel、图片转成pdf来实现在线预览。

前端在线预览pdf文件的实现方式可以参考这篇文章：《文档在线预览（四）使用js前端实现word、excel、pdf、ppt 在线预览》中 PDF文件实现前端预览部分.

这种方式的优点是:

1、和返回图片相比只会返回一个文件，前后端都不需要考虑多文件的问题。

2、主流的浏览器都自带支持pdf的展示。

这种方式的缺点是:

1、前端对pdf在线预览实现成本要比图片高一些。

如果想要展示效果好的话，其实可以将上篇文章《文档在线预览（一）通过将txt、word、pdf转成图片实现在线预览功能》说的内容和本文结合起来使用，即将文档里的内容都生成成图片（很可能是多张图片），然后将生成的图片全都放到一个html页面里，用html+css来保持样式并实现多张图片展示，再将html返回。开源组件kkfilevie就是用的就是这种做法.

kkfileview展示效果如下:

请添加图片描述

下图是kkfileview返回的html代码，从html代码我们可以看到kkfileview其实是将文件（txt文件除外）每页的内容都转成了图片，然后将这些图片都嵌入到一个html里，再返回给用户一个html页面.

实现方式4、纯前端实现在线预览

通过这次在线预览的调研，发现其实word、excel、pdf、ppt 等文件格式都有在线预览的前端js的开源组件，而且数量还不少，我整理了一下这些开源组件放在了下面的表格里.

文档格式	相关的开源组件
word(docx)	docx-preview、mammoth
pdf	pdf.js、pdfobject.js、vue-pdf
excel	sheetjs js-xlsx、canvas-datagrid、handsontable、DataTables
powerpoint（pptx）	pptxjs

这种方式是前端根据不同文件类型使用对应的在线预览组件进行在线预览。因为不同类型的在线预览组件不一样在使用时预览界面会存在差异，如果需要做的完善一点最好是把所有用到的组件都统一封装的一个在线预览的UI界面中。详细的信息可以参考这篇文章:

《文档在线预览（四）使用js前端实现word、excel、pdf、ppt 在线预览》。

这种方式的优点是:

1、后端没有工作量。

这种方式的缺点是:

1、前端工作量较大。

2、不同文件类型的显示UI不太一样，如果需要统一UI则会进一步增加前端的工作量。

3、除了图片和pdf的展示外，其他文件类型的展示不算非常理想。

实现方式5、服务器安装组件实现在线预览

通过这次在线预览的调研，发现几款商用或者开源服务器组件，安装之后即可实现在线预览，使用虽然有一定的学习成本，但是胜在功能比较完善。详细的信息可以参考这篇文章:

文档在线预览（五）在服务器部署组件来实现在线预览。

1、kkfileview

开源组件，只支持在线预览，不支持编辑。实现原理是通过转成图片+html的方式实现的（txt文件除外），源文件的内容都被转成了图片，然后放到html中以保持样式.

通过转成图片+html的方式实现的（txt文件除外），源文件的内容都被转成了图片，然后放到html中以保持样式。

支持doc、docx、ppt、pptx、wps、xls、xlsx、zip、rar、ofd、xmind、bpmn 、eml 、epub、3ds、dwg、psd 、mp4、mp3等类型.

预览效果如下:

2、OnlyOffice

开源组件，既能支持在线预览，也支持编辑。支持docx、xlsx、pptx、odt、ods、odp、doc、xls、ppt、pdf、txt、rtf、html、epub、csv等类型.

预览效果如下:

3、office online server

由微软出品付费商用组件，既能支持在线预览，也支持编辑。基本可以支持所有的Office文件格式。Office Online Server只能部署在Windows Server 2012 R2、Windows Server 2016或 Windows Server 2019 或 Windows Server 2022等服务器上.

预览效果如下。

4、Libre Office Online（不推荐）

开源组件，既能支持在线预览，也支持编辑。但是缺乏官方的支持，所以更推荐基于基于LibreOffice开发的Collabora Online.

5、Collabora Online

开源组件，既能支持在线预览，也支持编辑。基于LibreOffice办公套件的在线协作平台.

预览效果如下。

总结

1、转成图片的方式和转成html，都存在一定的问题，比如转图片的都是存在要处理多图片的问题，转html存在复杂样式丢失的问题。比较好的一种做法就是即将文档里的内容都生成成图片（很可能是多张图片），然后将生成的图片全都放到一个html页面里，用html+css来保持样式并实现多张图片展示，再将html返回。开源组件kkfilevie就是用的就是这种做法，可以参考一下kkfilevie的做法(都参考了为什么不直接拿来用，滑稽表情).

2、前端通过判断不同文件类型的使用对应的在线预览组件进行在线预览。因为不同类型的在线预览组件不一样在使用时预览界面会存在差异，如果需要做的完善一点最好是把所有用到的组件都统一封装的一个在线预览的UI界面中。但是这样做的话，前端的开发量较大.

3、后端统一将不同格式的文件转换成pdf格式实现在线预览，再由前端实现预览效果，这样能保留文件的一些样式的效果。这种方式实现成本比较低，预览效果也不错，简单的预览需求比较推荐.

4、服务器安装组件实现在线预览，使用虽然有一定的学习成本，功能比较完善，支持文件格式比也较多。甚至有的组件还能支持在线编辑。也是比较推荐的.

最后此篇关于文档在线预览总结篇的文章就讲到这里了,如果你想了解更多关于文档在线预览总结篇的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

26

4

0

文章推荐： python接口自动化封装导出excel方法和读写excel数据

文章推荐： asp.netcore如何获取客户端IP地址

文章推荐： .Net下验证MongoDB的Linq模式联合查询是否可用

文章推荐： ArcMap镶嵌数据集的创建、数据导入与数据范围修改方法

javascript - 如何获取另一个网站的屏幕截图/预览
有没有办法获取其他网站页面的屏幕截图？例如:您在输入中引入一个网址，按 Enter 键，然后脚本会为您提供所输入网站的屏幕截图。我设法使用 headless 浏览器来完成此操作，但我担心这可能会占用
ios - 预览 UICollectionViewCell
我如何在 UICollectionView 中添加下一个单元格的预览，当当前单元格被滑动时显示？这样感觉就像一堆卡片。我从 Chrome 的 iOS 应用程序及其标签切换器的实现中汲取了很多灵感。任何
javascript - 预览/摘要页面
HTML javascript 编程新手，我的页面实现有问题。我创建了多页 HTML 表单布局(使用 div)，它运行 4 个页面，大约有 140 个输入值(大多数是可选值)。我需要在实际提交之前实现
python - QFileDialog 预览
我正在尝试让 Qt5 QFileDialog 在选择图像打开时显示图像预览。方法一:扩展QFileDialog 我用了this implementation of the dialog它适用于 Qt
由于缺少程序集，TFS(预览)构建失败？
我是 TFS 的新手，并尝试通过托管的 TFS (tfspreview.com) 进行我的第一次自动构建，但由于缺少程序集而失败。我在解决方案中的一个项目引用了 Microsoft.WindowsA
xcode - 如何修复多个 SwiftUI 预览
我正在使用 SwiftUI 并编写了以下示例来展示我遇到的问题。当我添加多个按钮或多个文本时，它会创建两个单独的预览，但是当我在设备上运行应用程序时，它们会同时加载。附上一张照片: 我清理了我的构建文
swift - 从代码覆盖率中排除 SwiftUI 预览？
我无法将代码覆盖率提高到最低。 90% 因为 XCode 考虑了 PreviewProvider。我该怎么办？删除所有 SwiftUI 预览？或者有没有一种方法可以排除一些带有“PreviewPro
twitter - 如何确保链接支持 Twitter 预览？
首先，请注意我搜索了一个 SocialMediaStackExchange 来问这个问题，但似乎没有。这就是我想知道的。向 twitter 发布推文时，如果它是 youtube 链接或特定网站的
javascript - 谷歌地图API自动完成显示位置的 map 预览
我正在使用谷歌地图 API 自动完成来获取搜索的机构的城市和国家/地区。为此，我有一个输入字段和搜索位置的 map 预览。这是 jsfiddle，但它目前不起作用(https://jsfiddle.n
php - OpenCart mp3 预览
在 OpenCart 商店中提供音频预览的最佳方法和播放器是什么？这将涉及上传完整轨道，然后提取要播放的部分最佳答案 m3psplt是迄今为止您最好的选择。有时安装起来有点冒险(特别是在 Cent
django - 预览 PDF 文档
如果我运行: 127.0.0.1:8000/document/1/preview 此 pdf 文件已下载。我需要在 HTML 中显示它(带有打印功能的预览)。怎么做？ views.py from x
wagtail - 预览 Wagtail 页面和获取相关内联时出错
我在预览 Wagtail 页面时遇到错误，但在发布和实时查看时一切正常。我的设置是这样的: from django.db import models from modelcluster.fields
docker - Mattermost docker 预览
我是一个新手，我一直在尝试在 docker 上安装 Mattermost(slack 替代方案)的预览版来尝试一下。我一直遵循官方指南。拱门 Install Docker using the fol
django - 预览 PDF 文档
如果我运行: 127.0.0.1:8000/document/1/preview 此 pdf 文件已下载。我需要在 HTML 中显示它(带有打印功能的预览)。怎么做？ views.py from x
wagtail - 预览 Wagtail 页面和获取相关内联时出错
我在预览 Wagtail 页面时遇到错误，但在发布和实时查看时一切正常。我的设置是这样的: from django.db import models from modelcluster.fields
.net - 预览 .NET 颜色
VS 调试器给我: _Color = "{Name=ff000040, ARGB=(255, 0, 0, 64)}" 我怎样才能“看到”什么颜色？我尝试了一个 html 页面: ________
django - 脆表单布局中的 ImageField 预览
我想显示来自 ImageField 的图像。我正在使用 Django crispy forms 。似乎我需要使用 HTML 布局助手，但我不确定如何在此处访问模板变量。以下呈现一个空白图像标签: H
未显示 Android Studio 预览
The following classes could not be instantiated: androidx.fragment.app.FragmentContainerView (Open C
mysql - 预览 MySQL 连接的快速方法是什么？
我正在从事一个涉及数据集之间连接的项目，我们需要允许预览任意数据集之间的任意连接。这很疯狂，但这就是它有趣的原因。这是使用面向所以给定一个连接我想快速显示 ~10 行结果。我一直在围绕不同的方法进行
javascript - 文件上传/预览，无法更改图像尺寸
我正在尝试上传图像并在用户提交之前进行预览，但由于某种原因我无法更改 div 或图像的宽度或高度，并且它会以正常尺寸进行预览。我什至将它设置为 1px x 1px，但它仍然不起作用。 $(functi

首页

博学

6Ren·AI

商城