Python #Tools

目的

自己目前在用VNote写笔记,这个笔记软件非常便于我们管理本地Markdown文件,具体的用法后续会单独介绍,今天我要记录的是,怎么用python来复制特定的文件。

我的Hexo博客文件夹是Onedrive同步的,单独的文件夹。博客笔记要更新或者修改,我一般不直接对Hexo的文件操作,而是有一个单独的笔记本文件夹,觉得可以分享到网络上的笔记,我会复制到Hexo文件夹下的_post文件目录。这样的缺点是有时候会不小心直接在Hexo文件夹下改,而原来的本地文件夹的文件没有修改,造成版本混乱。而且手动复制也很麻烦。有没有更加自动化的操作呢?

用过Linux的都知道,Linux下有通过*来模糊匹配的方法,并且有cp命令来进行文件的复制。windows我不太清楚,打算通过python来实现,也算是一个学习python的机会。这是本片笔记的目的

方法

通过网络上查询,知道了可以通过osshutil包来操作文件,具体的

  • os.listdir() 可以展示某一个文件夹下的文件以及文件夹。缺点是只能展示一级文件夹。
  • os.walk() 可以遍历某一个文件夹下的所有文件以及文件夹,其返回值根据该介绍

    OS.walk() generate the file names in a directory tree by walking the tree either top-down or bottom-up. For each directory in the tree rooted at directory top (including top itself), it yields a 3-tuple (dirpath, dirnames, filenames).

os.walk()返回值有三个,其中

 * `dirpath` 是目标路径下所有文件的路径
 * `dirnames` 是目标路径的所有目录名称
 * `dilenames` 是各个路径下的文件名称列表.
  • shutil.copy 复制文件从一个文件夹到另外一个文件夹,但是文件的时间都是新的。
  • shutil.copy2 复制文件从一个文件夹到另外一个文件夹,但是文件的时间保留以前的。

具体的用法google以下就行,不在此赘述。

具体实现

具体实现时,首先插入所需要的包

1
2
import os
from shutil import copy2

然后定义好要操作的文件夹rootdir以及目标文件夹dstdir

1
2
3
rootdir = r'C:\Users\...'
dstdir = r'C:\Users\...'
# 我这里缺省掉了,具体的得替换自己的文件夹即可

然后需要定义一个函数来遍历文件,复制文件,其定义如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
def get_files(rootdir, dstdir):
counter = 0 #用来计数一共复制了多少个文件
for filepath, dirnames, filenames in os.walk(rootdir): #遍历文件夹
for filename in filenames: #遍历文件
if 'A_En' in filename or 'B_随笔' in filename or 'C_教程' in filename or 'D_收集' in filename and filename.endswith('.md'):
#设置条件,文件含有“A_En”或'B_随笔'...并且以“.md”文件结尾
counter = counter+1
# 结合文件夹和文件生成完整的绝对的路径
long_name = os.path.join(filepath, filename)
#f复制文件
copy2(long_name, dstdir)
print('已经复制了文件: '+long_name)

print('一共复制了'+str(counter) + '个文件')

注释已经写的很详细,就不再这里多讲了。

完整的代码

最后,附上完整代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import os
from shutil import copy2


def get_files(rootdir, dstdir):
counter = 0
for filepath, dirnames, filenames in os.walk(rootdir):
for filename in filenames:
if 'A_En' in filename or 'B_随笔' in filename or 'C_教程' in filename or 'D_收集' in filename and filename.endswith('.md'):
counter = counter+1
long_name = os.path.join(filepath, filename)
copy2(long_name, dstdir)
print('已经复制了文件: '+long_name)

print('一共复制了'+str(counter) + '个文件')


if __name__ == "__main__":
rootdir = r'C:Users\test1\'
dstdir = r'C:\Users\test\'
get_files(rootdir, dstdir)