Python读写docx文件的方法
时间:2019-04-14
本文章向大家介绍Python读写docx文件的方法,主要包括Python读写docx文件的方法使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。
这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。
帮助文档:http://python-docx.readthedocs.org/en/latest/
1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档
#coding:utf-8 import docx #新建文档 doc_new = docx.Document() #读取文档 doc = docx.Document(ur'C:\1.docx')
2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。
doc.save(path_or_stream)
3、对象集合。python-docx包含了word文档的相关对象集合。
doc.paragraphs #段落集合 doc.tables #表格集合 doc.sections #节 集合 doc.styles #样式集合 doc.inline_shapes #内置图形 等等...
4、插入段落。段落是word最基本的对象之一。
doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段” #默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式 doc.add_paragraph(u'第二段',style='Heading 2') #这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式 print [s.name for s in doc.styles if s.type==1]
5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。
#coding:utf-8 from docx import Document from docx.shared import RGBColor #这个是docx的颜色类 #新建文档 doc = Document() #新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格) style = doc.styles.add_style('style name 1', 2) #设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试) style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)
6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。
#插入一个空白段落 p = doc.add_paragraph('') p.add_run('123', style="Heading 1 Char") p.add_run('456') p.add_run('789', style="Heading 2 Char") #这样一个段落就应用了两个字符样式,中间“456”就没应用样式 print p.text #输出结果是u'123456789' 也还是连续的
7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。
p = doc.add_paragraph('') r = p.add_run('123') r.font.bold = True #加粗 r.font.italic = True #倾斜 等等...
8、表格操作。表格也是经常用到的一种对象类型。
#新建一个2x3的表格,style可以不写 table=doc.add_table(rows=2,cols=3,style=None) #可以用table 的rows和columns得到这个表格的行数和列数 print len(table.rows) print len(table.columns) #遍历表格 for row in table.rows: row.cells[0].text = '1' #print row.cells[0].text #新增行或列 table.add_row() table.add_column()
Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。
以上这篇Python读写docx文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
- lncRNA实战项目-第四步-得到表达矩阵的流程
- 一次切割日志引发的血案
- lncRNA实战项目-第三步-了解参考基因组及注释文件
- 如何通过iframe调用其他页面的内容
- WCF 学习总结1 -- 简单实例
- Java8 + Tomcat8 实现Websocket 例子
- Python Syslog Server 开发实例
- WCF 学习总结2 -- 配置WCF
- SQLite事务 SQLite插入多条语句为什么这么慢?.net (C#)
- Linux 应用程序开发入门
- LINQ to XML LINQ学习第一篇
- PHP 安全与性能
- Extjs 项目中常用的小技巧,也许你用得着(5)--设置 Ext.data.Store 传参的请求方式
- WPF备忘录(5)怎样修改模板中的控件
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 《0-1 背包问题》
- 使用分治思想 求数组中的最大和最小值
- python 入门笔记[语法基础(下)]
- Java 成员变量和属性的区别
- xmuC语言程序实践week 1 大作业
- 《01-背包问题-点菜》
- 模拟赛 2018 Benelux Algorithm Programming Contest (BAPC 18)(部分题)
- vue动态生成表单组件vue-form-maker
- 对顶堆求区间k小(大)数
- 祖传快读快写模板
- 进阶版树状数组
- Julia 生产环境就绪了吗?我们跟项目维护者聊了聊
- 《2017年内蒙古自治区第十二届大学生程序设计-超级密码》
- 知识图谱入门(三)
- xmuC语言程序实践week 2 大作业