在工作中时常会有繁重的文案工作,接触了python 之后,就会觉得这个比较简单了,python 操作word 和 excel 是比较常用的操作,相对比较简单,在本文中,我们就以 python 操作 word 为例来介绍一些简单的操作。
需要操作的前提是下载 docx 相关的操作类库 python-docx
,操作的环境和 IDE 环境如下所示
#使用的python 版本 python3.7.6 IDE pycharm2019 # 安装命令 pip install python-docx # 查看安装版本 pip list | grep python-docx
事先声明一下,python 操作的word版本必须是 docx
的版本,doc
的文档暂不支持。另外 docx 文档也是一种 xml 的数据组织格式, 首先了解一下其格式情况,
在word文档中,其主要结构如下所述:
# 创建一个document document = Document() # 创建一个标题 默认是一级标题 head = document.add_heading(level=4) run = head.add_run("这是一个四级标题 this is a title") # font.name 只能设置西文字体 run.font.name = 'Times New Roman' # 中文字体需要使用这种方式设置 run._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体') # 设置大小为11磅 run.font.size = Pt(16) # 段落字体颜色 run.font.color.rgb = RGBColor(128, 0, 128) # 是否加粗 run.bold = False # 是否斜体 run.italic = False
# 创建一个段落 ph = document.add_paragraph() # 添加段落 段落间距段落前13磅 段落后13磅 行间距固定值18磅 ph.paragraph_format.space_before = Pt(13) ph.paragraph_format.space_after = Pt(13) ph.paragraph_format.line_spacing = Pt(18) # 设置2.5倍行间距 ph.paragraph_format.line_spacing = 2.5 # 段落缩进 段落左缩进0.5英寸 left_indent right_indent # p.paragraph_format.left_indent = Inches(0.5) # 首行缩进 首行缩进0.9cm ph.paragraph_format.first_line_indent = Cm(0.9) # 段落左对齐 ph.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT run1 = ph.add_run("历史上第一个儿子当皇帝,老爹还活着的,当属刘太公,也就是刘邦的父亲。刘邦建立汉朝,称帝," "每天还去拜见刘太公,后来有大臣进言讲,虽然刘太公贵为皇帝父亲,但也为人臣,不应该由皇帝前去拜见。") run1.font.size = Pt(12) run1.font.color.rgb = RGBColor(128, 128, 128) run1.font.name = 'Times New Roman' run1._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 创建一个表格 3行四列 也可以不设置 table = document.add_table(rows=1, cols=3) # 自动调整表格 table.autofit = True # 设置表格样式 table.style = 'Table Grid' # 表头 hdr_cells = table.rows[0].cells hdr_cells[0].text = 'Qty' hdr_cells[1].text = 'Id' hdr_cells[2].text = 'Desc' # 准备数据 records = ( (3, '101', 'Spam'), (7, '422', 'Eggs'), (4, '631', 'Spam, spam, eggs, and spam') ) # 添加内容 for qty, id, desc in records: row_cells = table.add_row().cells row_cells[0].text = str(qty) row_cells[1].text = id row_cells[2].text = desc
# 保存文档 指定保存位置 document.save(r"demo_word.docx")
#获取文档中所有段落的样式根据样式进行修改文档 docu = Document(r'D:/xxx.docx') for p in docu.paragraphs: style_name = p.style.name print(style_name) #获取文档中所有的表格 for tb in docu.tables: # tb.rows 文档中所有的行 tb.rows[0].cells 某一行的所有单元格 # 循环单元格进行编辑样式操作
# word表格单元格背景颜色 def set_cell_background_color(cell, color): # print(colorStr) shading_elm_1 = parse_xml(r'<w:shd {} w:fill="{color_value}"/>'.format(nsdecls('w'), color_value=color)) cell._tc.get_or_add_tcPr().append(shading_elm_1) cells1[i].paragraphs[0].style = "表格体" # 修改背景颜色为白色 set_cell_background_color(rows.cells[0], "#FFFFFF") # 查看文档内所有的样式 for sts in document.styles: print(sts) # 查看word文档结构 print(document._element.xml)
最终产生的效果如下图所示:
在本章中,介绍了怎么使用python-docx创建wor文档,并举例说明了创建段落,表格,标题,图片等要点。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
长按识别二维码并关注微信
更方便到期提醒、手机管理