侧边栏壁纸
博主昵称
易小灯塔

90后码农,AIGC/摄影/ACG爱好者

  • 累计撰写 176 篇文章
  • 累计收到 45 条评论

使用Python的pdf2docx把PDF转为word文件

易小灯塔
2022-09-08 / 0 评论 / 1,164 阅读 / 正在检测是否收录...
温馨提示:
本文最后更新于2023年10月09日,已超过545天没有更新,若内容或图片失效,请留言反馈。

朋友碰到个PDF转word的需求, 网上一大堆工具都是付费的, 问我有没有办法.

我搜了下python的pdf2docx就可以实现, 记录一下

要求Python版本>=3.6

通过pip安装库:

pip install pdf2docx

作为Python库使用

from pdf2docx import Converter

pdf_file = '/path/to/xxx.pdf'
docx_file = 'path/to/xxx.docx'

# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file) # 默认参数start=0, end=None
cv.close()

# more samples
# cv.convert(docx_file, start=1) # 转换第2页到最后一页
# cv.convert(docx_file, pages=[1,3,5]) # 转换第2,4,6页

作为命令行工具调用

pdf2docx convert xxx.pdf xxx.docx

可以通过--start--end或者--pages指定页面范围。

转换效果可能不是100%完美, 有可能图片会错位, 这时候可以试试微软Office, WPS, 极速Office不同的软件打开试试

0

评论 (0)

OωO
  • ::(呵呵)
  • ::(哈哈)
  • ::(吐舌)
  • ::(太开心)
  • ::(笑眼)
  • ::(花心)
  • ::(小乖)
  • ::(乖)
  • ::(捂嘴笑)
  • ::(滑稽)
  • ::(你懂的)
  • ::(不高兴)
  • ::(怒)
  • ::(汗)
  • ::(黑线)
  • ::(泪)
  • ::(真棒)
  • ::(喷)
  • ::(惊哭)
  • ::(阴险)
  • ::(鄙视)
  • ::(酷)
  • ::(啊)
  • ::(狂汗)
  • ::(what)
  • ::(疑问)
  • ::(酸爽)
  • ::(呀咩爹)
  • ::(委屈)
  • ::(惊讶)
  • ::(睡觉)
  • ::(笑尿)
  • ::(挖鼻)
  • ::(吐)
  • ::(犀利)
  • ::(小红脸)
  • ::(懒得理)
  • ::(勉强)
  • ::(爱心)
  • ::(心碎)
  • ::(玫瑰)
  • ::(礼物)
  • ::(彩虹)
  • ::(太阳)
  • ::(星星月亮)
  • ::(钱币)
  • ::(茶杯)
  • ::(蛋糕)
  • ::(大拇指)
  • ::(胜利)
  • ::(haha)
  • ::(OK)
  • ::(沙发)
  • ::(手纸)
  • ::(香蕉)
  • ::(便便)
  • ::(药丸)
  • ::(红领巾)
  • ::(蜡烛)
  • ::(音乐)
  • ::(灯泡)
  • ::(开心)
  • ::(钱)
  • ::(咦)
  • ::(呼)
  • ::(冷)
  • ::(生气)
  • ::(弱)
  • ::(狗头)
泡泡
阿鲁
颜文字
取消

文章导读