大家好,我是小朋克。我们这些工作人员在平时工作的时候,难免会转换一些文档格式行。我们将讨论几种主流的PDF转Word SDK,并分析它们在我们农民工实际工作中的优缺点。
1.扎实:老式的PDF转Office文件传输库已经积累了几十年。
2.Aspose:相互支持多种文件格式,包括PDF到word。
3.Foxit:自主研发PDF,最近刚上线PDF to Office。
4.ComPDFKit:最近某新锐公司更新频率很高。补充谢谢。
话不多说,直接对比PDF和word的效果。
对比表:我选取了一些不同特点的文档进行测试,页面很多,有表格,也有图文混排。涉及论文、cad制图、金融等领域,先看这些文档比较费时间。


12个文档中,foxit有3个文档转换失败,其他3个SDK文档全部转换成功。由于试用的原因,Aspose SDK只能转换前四页,但在某些情况下,它比其他三页要慢。综合来看,ComPDFKit的转换速度最快。接下来,我们来看看具体效果。
效果文档-651页文档。pdf原始文档

SDK厂商间文件传输的比较
ComPDFKit:基本没有问题,只是字体和原文档不一样。


付鑫:我们可以看到会有一些小的识别错误,主要是在跨行的情况下,还有一些比较大胆的识别错误。


扎实:基本没有问题,没有错误,但也有字体差异。


效力文件-证券文件。pdf原始文档:

SDK厂商的处理结果:
ComPDFKit:整体排版正确。第二页有些字体会被涂抹,有些字会出文本框。

Foxit:整体排版正确,第二页部分字体会有涂抹,第一页图表会出文本框。

实心:整体排版正确,首页图表会出现超出文本框,首页页脚图片透明度识别错误。

Aspose:整体布局正确,第二页部分文字下有投影。

影响document-2.pdf原始文档:

SDK厂商的处理结果:
ComPDFKit:公式部分的转换是转换文档中原来的字符,所以会有乱码。

Foxit:没有区分加粗的副标题和细的文字,部分文字被图片代替,排版比较混乱。

实心:公式部分支持较好,但部分符号被变形图片代替,影响观感。

效果文档-图文混排。pdf原始文档:

SDK厂商的处理结果:
图文混排,维护的很好。
ComPDFkit,foxit,solid的字体和原文档解决的不好,aspose最接近,但是aspose的背景图缩放不正确。ComPDFkit在顶部截掉了几个字。
ComPDFKit:

Foxit:

固体:

Aspose:

效果文档-简单的图文表格。pdf- Foxit的文本背景形状发生了变化,变得不规则。
-Aspose,背景图变小了。
-ComPDFKit的时间被部分削减。
-固体效果很好。
原始文档:

SDK厂商的处理结果:
ComPDFKit:

Foxit:

固体:

Aspose:

综上所述,这些SDK在将pdf转换为word时各有利弊。应该是PDF转Word的算法各有侧重。可以根据自己的项目情况和项目预算选择合适的SDK公司。
微信扫码
QQ扫码
您的IP:10.1.228.218,2025-12-30 13:40:02,Processed in 0.35616 second(s).