怎样处理PDF文件

2021年9月27日 | 分类: 【软件】

需求:导出PDF页面为图片

https://smallpdf.com/cn/pdf-to-jpg

需求:提取PDF中的表格并合并为Excel的一个标签页

1. 下载 PDF 到本地

2. 从 PDF 中提取 EXCEL

工具:https://webtool.pdflux.com/convert/

使用 Google Chrome 浏览器打开以上网址,上传PDF文件后,等待片刻即可完成转换,生成可供下载的 .xls 文件。

3. 将EXCEL中的多个标签页合并到一个标签页里

因为 PDF 分页,导致得到的 .xls 文件包含多个标签页,可以使用 WPS 轻松实现合并。

下载:https://www.wps.cn/

打开「表格(Excel)」文档,点击「数据-合并表格-多个工作表合并成一个工作表」;勾选需合并的工作表即可。

参考:https://jingyan.baidu.com/article/cbcede071f0b9f02f40b4d09.html

按:可以使用 Python 脚本实现以上功能。

扩展:https://www.zhihu.com/question/382055448
扩展:https://www.sohu.com/a/342244631_505915
扩展:https://blog.csdn.net/weixin_41010198/article/details/88744794