Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】
时间:2019-03-30
本文章向大家介绍Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】,主要包括Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
本文实例讲述了Python编程实现两个文件夹里文件的对比功能。分享给大家供大家参考,具体如下:
#-*-coding:utf-8-*- #=============================================================================== # 目录对比工具(包含子目录 ),并列出 # 1、A比B多了哪些文件 # 2、B比A多了哪些文件 # 3、二者相同的文件:文件大小相同 VS 文件大小不同 (Size相同文件不打印:与Size不同文件显示未排序) #=============================================================================== import os, time,difflib AFILES = [] #EE BFILES = [] #SVN COMMON = [] #EE & SVN def getPrettyTime(state): return time.strftime('%y-%m-%d %H:%M:%S', time.localtime(state.st_mtime)) # def getpathsize(dir): #获取文件大小的函数,未用上,仅供学习.故注释掉 # size=0 # for root, dirs, files in os.walk(dir): # #root:目录:str 如: C:\CopySVN\SystemObject\TopoProcedure\Built-in\ # #dirs:目录名称:列表: 如 ['Parsers'] # #files:名称:列表: 如 ['011D0961FB42416AA49D5E82945DE7E9.og',...] # #file:目录:str, 如 011D0961FB42416AA49D5E82945DE7E9.og # for file in files: # path = os.path.join(root,file) # size = os.path.getsize(path) # return size def dirCompare(apath,bpath): afiles = [] bfiles = [] for root, dirs , files in os.walk(apath): for f in files: afiles.append(root + "\\" + f) for root, dirs , files in os.walk(bpath): for f in files: bfiles.append(root + "\\" + f) #sizeB = os.path.getsize(root + "\\" + f) 此处定义的size无法在commonfiles进行比较. (A,B在各自的循环里面) # 去掉afiles中文件名的apath (拿A,B相同的路径\文件名,做成集合,去找交集) apathlen = len(apath) aafiles = [] for f in afiles: aafiles.append(f[apathlen:]) # 去掉bfiles中文件名的bpath bpathlen = len(bpath) bbfiles = [] for f in bfiles: bbfiles.append(f[bpathlen:]) afiles = aafiles bfiles = bbfiles setA = set(afiles) setB = set(bfiles) #print('%$%'+str(len(setA))) #print('%%'+str(len(setB))) commonfiles = setA & setB # 处理共有文件 #print ("===============File with different size in '", apath, "' and '", bpath, "'===============") #将结果输出到本地 #with open(os.getcwd()+'diff.txt','w') as di: #di.write("===============File with different size in '", apath, "' and '", bpath, "'===============") for f in sorted(commonfiles): sA=os.path.getsize(apath + "\\" + f) sB=os.path.getsize(bpath + "\\" + f) if sA==sB: #共有文件的大小比较 #pass #print (f + "\t\t" + getPrettyTime(os.stat(apath + "\\" + f)) + "\t\t" + getPrettyTime(os.stat(bpath + "\\" + f))) #以下代码是处理大小一致,但是内容可能不一致的情况 #print("in sa=sb") #print(os.getcwd()) saf=[] sbf=[] sAfile=open(apath + "\\" + f) iter_f=iter(sAfile) for line in iter_f: saf.append(line) sAfile.close() sBfile=open(bpath + "\\" + f) iter_fb=iter(sBfile) for line in iter_fb: sbf.append(line) sBfile.close() saf1=sorted(saf) sbf1=sorted(sbf) if(len(saf1)!=len(sbf1)): with open(os.getcwd()+'\\comment_diff.txt','a') as fp: print(os.getcwd()) fp.write(apath + "\\" + f+" lines size not equal "+bpath + "\\" + f+'\n') else: for i in range(len(saf1)): #print("into pre") if(saf1[i]!=sbf1[i]): print('into commont') with open(os.getcwd()+'\\comment_diff.txt','a') as fp1: fp1.write(apath + "\\" + f+" content not equal "+bpath + "\\" + f+'\n') break else: with open (os.getcwd()+'\\diff.txt','a') as di: di.write("File Name=%s EEresource file size:%d != SVN file size:%d" %(f,sA,sB)+'\n') #print ("File Name=%s EEresource file size:%d != SVN file size:%d" %(f,sA,sB)) # 处理仅出现在一个目录中的文件 onlyFiles = setA ^ setB aonlyFiles = [] bonlyFiles = [] for of in onlyFiles: if of in afiles: aonlyFiles.append(of) elif of in bfiles: bonlyFiles.append(of) #print ("###################### EE resource ONLY ###########################") #print ("#only files in ", apath) for of in sorted(aonlyFiles): with open (os.getcwd()+'\\EEonly.txt','a') as ee: ee.write(of+'\n') #print (of) #print ("*"*20+"SVN ONLY+"+"*"*20) #print ("#only files in ", bpath) for of in sorted(bonlyFiles): with open (os.getcwd()+'\\svnonly.txt','a') as svn: svn.write(of+'\n') #print (of) if __name__ == '__main__': FolderEE = 'D:\\search\\bb\\ObjectGroup - Copy\\ObjectGroup\\Built-in' FolderSVN = 'D:\\search\\bb\\ObjectGroup\\ObjectGroup\\Built-in' dirCompare(FolderEE, FolderSVN) print("done!")
PS:这里再为大家推荐一款功能相似的在线工具供大家参考使用:
在线文本比较工具:
http://tools.jb51.net/aideddesign/txt_diff
更多关于Python相关内容感兴趣的读者可查看本站专题:《Python文件与目录操作技巧汇总》、《Python文本文件操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》
希望本文所述对大家Python程序设计有所帮助。
- jackson简单使用,对象转json,json转对象,json转list
- 2016.07 第3周 群问题分享
- jackson error 含义log
- java删除文件夹
- JSP自定义tag
- gradle中使用嵌入式(embedded) tomcat, debug 启动
- spring in action 4th --- quick start
- Date, TimeZone, MongoDB, java中date的时区问题
- spring boot 添加拦截器
- spring boot 部署为jar
- 重定向Http status code 303 和 302
- centos7查看系统版本,查看机器位数x86-64
- 在centos7中添加一个新用户,并授权
- 如何优化coding
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 设计模式--外观模式
- 设计模式--模板模式
- springBoot快速入门
- springBoot配置文件
- springBoot按条件装配:Condition
- springBoot @Enable*注解的工作原理
- 使用dom4j修改XML格式的字符串
- springBoot @EnableAutoConfiguration深入分析
- SpringBoot事件监听
- SpringBoot Web(SpringMVC)
- SpringBoot使用servletAPI与异常处理
- Redis数据迁移至Codis集群方案
- Oracle分析函数
- springBoot定制内嵌的Tomcat
- SpringBoot JDBC/AOP