Python办公:自动化生成latex代码来整理大量的图片到PDF
Python #Tools
介绍
本篇笔记主要是记录我利用python生成LaTex文件来将很多图片整理并保存到PDF的过程。作为科研人员,或者学生,生活中常常会遇到这样的场景:
- 在听取报告的时候,我们经常会将我们感兴趣的报告的PPT拍下来,后续再去查阅相关资料。理想很丰满,现实很骨感,实际上很多时候PPT拍完我们就不再会去整理了,因为太麻烦了。一系列照片,挨个分类保存还是很麻烦的。
- 在上课的时候,有的老师不会发PPT,遇到有疑问的也是手机保存一下。后续整理笔记也是会遇到照片太多不方便整理的情况。
- 做实验的时候,或者仿真的时候,也会产生很多图片,我们想将这些图片放到PPT里面展示,但是图片太多的时候,挨个选取图片、插入、排版都会浪费我们不少的时间。
针对这个痛点,我决定用所学的编程知识让这一过程自动化,基本思路是:
- 图片排版用Latex来完成,可以生成PDF的报告或者Beamer形式。
- 插入图片的Latex代码用Python来完成。
下面是具体的实现
准备一个模板latex文件
我们需要先准备一个模板Latex文件,模板文件大致有所有的需要的基本代码,我的大致如下:
1 | \documentclass[mathserif]{beamer} |
我们要做的就是用Python读取这个模板文件的内容,然后将图片按照顺序贴出来。首先需要写一个函数可以列出我们所需要插入的图片文件的文件名列表1
2
3
4
5
6
7
8
9def list_files(dstdir):
pnglist = []
for filepath, dirnames, filenames in os.walk(dstdir):
for filename in filenames:
if "2" in filename and filename.endswith('.png'):
pnglist.append(filename)
return pnglist
# To obtain the str needed in latex file
然后是读取我们的模板文件的内容1
2
3
4
5
6
7
8def obtain_initial(filename):
lines = []
with open(filename, 'r', encoding='utf-8') as f:
for line in f.readlines():
if line != '\\end{document}':
lines.append(line)
f.close()
return lines
然后是有可能得写一个函数对图片名字进行纠正,比如如果我是用微信截图的,那么图片文件都会有”微信截图-“这样的开头,那么我就得写一个程序将前面的中文字符去掉,不然latex又得额外使用包来处理中文字符了。下面是我的代码1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17# To rename files by removing Chinese characters
def rename_png(filelist):
for file in filelist:
filenamestr = str(file)
filenew = filenamestr[5:]
print(filenew)
try:
os.rename(filenamestr, filenew)
except Exception as e:
print(e)
print('rename file fail\r\n')
else:
print('rename file success\r\n')
print('END')
然后最关键的一步就是将模板文件和插入图片的代码分别写到latex文件,其步骤如下1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19# To generate latex files
def gentex(filename, filelist):
num = len(filelist)
modelfile = obtain_initial('./model_beamer.tex')
with open(filename, 'w', encoding='utf-8') as f:
for line in modelfile:
f.write('%s\n' % line)
for l in range(num):
f.write('\n')
f.write('\\begin{frame}\n')
f.write('\\begin{figure}\n')
f.write('\\centering\n')
f.write('\\includegraphics[width=2.5in]{%s}\n' % filelist[l])
f.write('\\end{figure}\n')
f.write('\\end{frame}\n')
f.write('\\end{document}\n')
f.close()
具体运行的全部代码我会附在末尾。最后整理出来的效果是啥样子的呢?下面是我的结果
一共46页PPT如果是自己手动插入图品会浪费很多的时间,但是我们这个方法就是非常自动化的方法了。
代码
1 | import os |