AI智能
改变未来

Python 3 Office文档格式转换

上次讲到,要快速提取word与excel文件中的图片,有一个前提条件,那就是操作的目标文件扩展名必须是要为.docx\\.xlsx才可以。这次我们用Python3来实现.doc\\.xls文件自动转换为.docx\\.xlsx。

Python3实现代码

import win32com.client as win32  # 引入win32com库(win32com功能强大,可以操作word、调用宏等等等)
import os            #引入os库(文件及目录操作)

#自定义xls转xlsx功能函数
defxls_xlsx(fname):
  excel=win32.gencache.EnsureDispatch(\'Excel.Application\')
  xls=excel.Workbooks.Open(fname)   #目标路径下的文件
  xls.SaveAs(fname+\'x\',FileFormat=51)  #51为xlsx56为xls
  xls.Close()              #关闭资源
  excel.Application.Quit()        #退出Excel
  os.remove(fname)            #删除原Excel文件

#自定义doc转docx功能函数
defdoc_docx(fname):
  word=win32.Dispatch(\'Word.Application\')
    doc = word.Documents.Open(fname)  # 目标路径下的文件
    doc.SaveAs(fname+\'x\', 16)  # 16为xlsx文件格式
  doc.Close()        #关闭资源
  word.Quit()        #退出word
    os.remove(fname)           #删除原Word文件

if __name__==\"__main__\":        #主程序入口
  xls_xlsx(\'xx\\xx\\xx.xls\')  #调用xlsx转换函数
    doc_docx(\'xx\\xx\\xx.doc\')    #调用docx转换函

以上是功能实现的Pyhton3源代码,感兴趣的小伙伴可以自己动手尝试一下。

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » Python 3 Office文档格式转换