gpt4 book ai didi

用python标准库difflib比较两份文件的异同详解

转载 作者:qq735679552 更新时间:2022-09-27 22:32:09 28 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章用python标准库difflib比较两份文件的异同详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

【需求背景】 。

有时候我们要对比两份配置文件是不是一样,或者比较两个文本是否异样,可以使用linux命令行工具diff a_file b_file,但是输出的结果读起来不是很友好。这时候使用python的标准库difflib就能满足我们的需求.

下面这个脚本使用了difflib和argparse,argparse用于解析我们给此脚本传入的两个参数(即两份待比较的文件),由difflib执行比较,比较的结果放到了一个html里面,只要找个浏览器打开此html文件,就能直观地看到比较结果,两份文件有差异的地方会高亮显示出来.

【程序正文】 。

以python2.7为例,compare_two_files.py程序正文:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
#!/bin/env python
# -*- coding: utf-8 -*-
 
# 20180430
 
import difflib
import sys
import argparse
 
 
# 读取建表语句或配置文件
def read_file(file_name):
  try :
   file_desc = open (file_name, 'r' )
   # 读取后按行分割
   text = file_desc.read().splitlines()
   file_desc.close()
   return text
  except ioerror as error:
   print 'read input file error: {0}' . format (error)
   sys.exit()
 
 
# 比较两个文件并把结果生成一份html文本
def compare_file(file1, file2):
  if file1 = = " " or file2 == " ":
   print '文件路径不能为空:第一个文件的路径:{0}, 第二个文件的路径:{1} .' . format (file1, file2)
   sys.exit()
  else :
   print "正在比较文件{0} 和 {1}" . format (file1, file2)
  text1_lines = read_file(file1)
  text2_lines = read_file(file2)
  diff = difflib.htmldiff() # 创建htmldiff 对象
  result = diff.make_file(text1_lines, text2_lines) # 通过make_file 方法输出 html 格式的对比结果
  # 将结果写入到result_comparation.html文件中
  try :
   with open ( 'result_comparation.html' , 'w' ) as result_file:
    result_file.write(result)
    print "0==}==========> successfully finished\n"
  except ioerror as error:
   print '写入html文件错误:{0}' . format (error)
 
 
if __name__ = = "__main__" :
  # to define two arguments should be passed in, and usage: -f1 fname1 -f2 fname2
  my_parser = argparse.argumentparser(description = "传入两个文件参数" )
  my_parser.add_argument( '-f1' , action = 'store' , dest = 'fname1' , required = true)
  my_parser.add_argument( '-f2' , action = 'store' , dest = 'fname2' , required = true)
  # retrieve all input arguments
  given_args = my_parser.parse_args()
  file1 = given_args.fname1
  file2 = given_args.fname2
  compare_file(file1, file2)

【待比较的文件】 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
两份文件分别是old_ddl_file和new_ddl_file,内容分别是——
old_ddl_file文件内容
create external table raw_tags(
p0 string comment ‘uid',
p3 string comment ‘tag name, e.g. news, games, fairs, shoopingurl',
p4 string comment ‘e.g. 0 , games',
p11 int comment ‘gender',
dt string comment ‘date, like 26 / 6 / 2017 ',
action string comment ‘clickmodule, click_taghead_link, clicklink')
clustered by (
dt)
into 4 buckets
row format delimited
fields terminated by ‘,'
stored as inputformat
‘org.apache.hadoop.mapred.textinputformat'
outputformat
‘org.apache.hadoop.hive.ql.io.hiveignorekeytextoutputformat'
location
‘hdfs: / / hdfs - ha / apps / hive / warehouse / ksai.db / raw_tags'
tblproperties (
‘numfiles '=' 1 ',
‘numrows '=' 0 ',
‘rawdatasize '=' 0 ',
‘totalsize '=' 70575510 ',
‘transient_lastddltime '=' 1500469448 ')
 
new_ddl_file文件内容
create external table raw_tags(
p0 string comment ‘uid',
p3 string comment ‘tag name, e.g. news, games, fairs, shoopingurl',
p4 string comment ‘e.g. 0 , games',
p11 int comment ‘gender',
dt string comment ‘date, like 26 / 6 / 2017 ',
action string comment ‘clickmodule, click_taghead_link, clicklink')
row format delimited
fields terminated by ‘,'
stored as inputformat
‘org.apache.hadoop.mapred.textinputformat'
outputformat
‘org.apache.hadoop.hive.ql.io.hiveignorekeytextoutputformat'
location
‘hdfs: / / hdfs - ha / apps / hive / warehouse / ksai.db / raw_tags'
tblproperties (
‘column_stats_accurate '=' {\”basic_stats\”:\”true\”}',
‘numfiles '=' 0 ',
‘numrows '=' 0 ',
‘rawdatasize '=' 0 ',
‘totalsize '=' 0 ',
‘transient_lastddltime '=' 1521546069 ')

肉眼很难看出来区别吧?

【执行结果】 。

那么就使用上面的脚本来比较,在linux命令行的使用方法 python -f1 file1 -f2 file2 也就是:

python compare_two_files.py -f1 old_ddl_file -f2 new_ddl_file 。

用python标准库difflib比较两份文件的异同详解

再把运行结果产生的html文件下载到本地,用任一种浏览器打开即可,如截图:

用python标准库difflib比较两份文件的异同详解

运行结果:

用python标准库difflib比较两份文件的异同详解

使用浏览器查看html文件,可以看到,里面给出了各种颜色标注的图例说明,一目了然.

以上这篇用python标准库difflib比较两份文件的异同详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我.

原文链接:https://blog.csdn.net/qq_31598113/article/details/80153000 。

最后此篇关于用python标准库difflib比较两份文件的异同详解的文章就讲到这里了,如果你想了解更多关于用python标准库difflib比较两份文件的异同详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com