gpt4 book ai didi

c++ - Excel 比较两个 csv 文件并显示差异

转载 作者:行者123 更新时间:2023-11-28 01:05:50 28 4
gpt4 key购买 nike

我正在比较两组 csv 文件和/或一个 csv 文件和一个 .txt 文件。我“认为”为了简单起见,可能需要将 .txt 文件转换为 csv 文件,但这可能需要也可能不需要。我想使用 excel、c++ 或 python。我需要将一个“接受的”值列表与一个被测量的列表进行比较,如果存在的话,找出它们之间的差异。 Excel 可能是执行此操作的最简单方法,但 python 或 c++ 也可能同样有效。这不是家庭作业,所以不要担心这类事情。非常感谢代码建议和/或模板。或网站链接

编辑 1

我读过有关 Python 的 difflib 或不同类的内容,但不熟悉如何使用它,而且可能比我想要的更多。

编辑 2

两个文件都有一系列的列(没有在它们之间画线或任何东西),在那些“命名”列下面会有数字。我需要比较文件 1 中第 1 列中的数字与文件 2 中第 1 列中的数字,如果有差异,则显示另一个 csv 文件中的差异

最佳答案

您可以使用 ADO(ODBC/JET/OLEDB 文本驱动程序)将“体面的”.txt/.csv/.tab/.flr 文件视为来自每种支持 COM 的语言的 SQL 数据库中的表。然后可以使用 SQL 的强大功能(DISTINCT、GROUP、(LEFT)JOINS、...)进行比较。

针对您的评论添加:

这是你的问题,我不想把你逼到你不想去的地方。但是如果您需要比较表格数据,SQL 是一个很好的(最好的?)工具。作为发现两个 .txt 文件差异的脚本输出的证据:

======= The .txt files to play with
------- file1.txt
"AC";"AM"
40000;-19083,00
40100;20000,00
40200;350004,00
40300;3498,99

------- file2.txt
"AC";"AM"
40000;-19083,00
40300;3498,99
40105;-234567,00
40200;350,00

======= Some diagnostic SQL
------- <NULL> indicates: In F1 but not in F2 (LEFT JOIN)
SELECT T1.AC, T1.AM, T2.AM FROM [file1.txt] AS T1 LEFT JOIN [file2.txt] AS T2 ON (T1.AC =
T2.AC)
------- Result
AC File1 File2
40000 -19083 -19083
40100 20000 <NULL>
40200 350004 350
40300 3498,99 3498,99

------- <NULL> indicates: Not in the other file (LEFT JOIN, UNION)
SELECT T1.AC, T1.AM, T2.AM FROM [file1.txt] AS T1 LEFT JOIN [file2.txt] AS T2 ON (T1.AC =
T2.AC) UNION SELECT T2.AC, T1.AM, T2.AM FROM [file2.txt] AS T2 LEFT JOIN [file1.txt] AS T1
ON (T1.AC = T2.AC)
------- Result
AC File1 File2
40000 -19083 -19083
40100 20000 <NULL>
40105 <NULL> -234567
40200 350004 350
40300 3498,99 3498,99

------- the problems: missing, different values
SELECT T1.AC, T1.AM, T2.AM FROM [file1.txt] AS T1 LEFT JOIN [file2.txt] AS T2 ON (T1.AC =
T2.AC) WHERE T2.AM IS NULL OR T1.AM <> T2.AM UNION SELECT T2.AC, T1.AM, T2.AM FROM [file2.
txt] AS T2 LEFT JOIN [file1.txt] AS T1 ON (T1.AC = T2.AC) WHERE T1.AM IS NULL OR T1.AM <>
T2.AM
------- Result
AC File1 File2
40100 20000 <NULL>
40105 <NULL> -234567
40200 350004 350

进一步补充:

这个 article 处理 ADO 和文本文件;查找文件 adoNNN.chm(NNN=版本号,例如 210)在您的计算机上;这是一个关于ADO.

您可以使用 Access 或 OpenOffice Base 来试验 SQL 语句应用于链接/引用(未导入!)文本数据库。

在您掌握了最初的障碍后,编写脚本/程序会很容易:连接到数据库,即到包含文件和 schema.ini 的文件夹文件来定义 files=tables 的结构。

上面的输出是由:

  Const adClipString = 2

Dim oFS : Set oFS = CreateObject( "Scripting.FileSystemObject" )
Dim sDir : sDir = oFS.GetAbsolutePathName( ".\txt" )
Dim oDB : Set oDb = CreateObject( "ADODB.Connection" )
oDB.Open "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" & sDir & ";Extended Properties=""text"""
Dim sSQL
Dim sFiNa
WScript.Echo "=======", "The .txt files to play with"
For Each sFiNa In Array( "file1.txt", "file2.txt" )
WScript.Echo "-------", sFiNa
WScript.Echo oFS.OpenTextFile( "txt\" & sFiNa ).ReadAll()
Next

WScript.Echo "=======", "Some diagnostic SQL"
Dim aSQL
For Each aSQL In Array( _
Array( "<NULL> indicates: In F1 but not in F2 (LEFT JOIN)" _
, Join( Array( _
"SELECT T1.AC, T1.AM, T2.AM FROM" _
, "[file1.txt] AS T1" _
, "LEFT JOIN [file2.txt] AS T2 ON (T1.AC = T2.AC)" _
), " " ) ) _
, Array( "<NULL> indicates: Not in the other file (LEFT JOIN, UNION)" _
, Join( Array( _
"SELECT T1.AC, T1.AM, T2.AM FROM" _
, "[file1.txt] AS T1" _
, "LEFT JOIN [file2.txt] AS T2 ON (T1.AC = T2.AC)" _
, "UNION" _
, "SELECT T2.AC, T1.AM, T2.AM FROM" _
, "[file2.txt] AS T2" _
, "LEFT JOIN [file1.txt] AS T1 ON (T1.AC = T2.AC)" _
), " " ) ) _
, Array( "the problems: missing, different value" _
, Join( Array( _
"SELECT T1.AC, T1.AM, T2.AM FROM" _
, "[file1.txt] AS T1" _
, "LEFT JOIN [file2.txt] AS T2 ON (T1.AC = T2.AC)" _
, "WHERE T2.AM IS NULL OR T1.AM <> T2.AM" _
, "UNION" _
, "SELECT T2.AC, T1.AM, T2.AM FROM" _
, "[file2.txt] AS T2" _
, "LEFT JOIN [file1.txt] AS T1 ON (T1.AC = T2.AC)" _
, "WHERE T1.AM IS NULL OR T1.AM <> T2.AM" _
), " " ) ) _
)
sSQL = aSQL( 1 )
WScript.Echo "-------", aSQL( 0 )
WScript.Echo sSQL
Dim oRS : Set oRS = oDB.Execute( sSQL )
WScript.Echo "------- Result"
WScript.Echo Join( Array( "AC", "File1", "File2" ), vbTab )
WScript.Echo oRS.GetString( adClipString, , vbTab, vbCrLf, "<NULL>" )
Next
oDB.Close

如果删除/忽略脂肪(创建 SQL 语句、诊断输出),它会沸腾减少到 6 行

  Dim oDB  : Set oDb = CreateObject( "ADODB.Connection" )
oDB.Open "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" & sDir & ";Extended Properties=""text"""
sSQL = "..."
Dim oRS : Set oRS = oDB.Execute( sSQL )
WScript.Echo oRS.GetString( adClipString, , vbTab, vbCrLf, "<NULL>" )
oDB.Close

它可以很容易地“移植”到每一种支持 COM 的语言,因为 ADO对象完成所有繁重的工作。 .GetString 方法派上用场,当你想要保存结果集:只需旋转分隔符/定界符/空参数并将其转储到文件

  oFS.CreateTextFile( ... ).WriteLine oRS.GetString( _
adClipString, , ",", vbCrLf, ""
)

(不要忘记将该表的定义添加到您的 schema.ini 中)。的 当然你也可以使用“SELECT/INSERT INTO”,但这样的语句可能不会 很容易正确/通过 ADO 文本驱动程序的解析器。

加法计算:

从包含以下内容的 5 x 2 主/批准文件开始:

Num0    Num1    Num2    Num3    Num4
7,6 6,1 3,8 0,9 8,9
0,9 9,4 4,7 8,8 9,9

将其转换为expected.txt

Num0    Num1    Num2    Num3    Num4    Spot
7,6 6,1 3,8 0,9 8,9 1
0,9 9,4 4,7 8,8 9,9 2

通过附加 Spot 列使其符合

[expected.txt]
ColNameHeader=True
CharacterSet=1252
Format=Delimited(;)
Col1=Num0 Float
Col2=Num1 Float
Col3=Num2 Float
Col4=Num3 Float
Col5=Num4 Float
Col6=Spot Integer

在您的 schema.ini 文件中。同样,将测量文件转换为:

Num0    Num1    Num2    Num3    Num4
7,1 1,1 3,8 0,9 8,9
0,9 9,4 4,7 8,8 9,9

到measured.txt

Num0    Num1    Num2    Num3    Num4    Spot
7,1 1,1 3,8 0,9 8,9 1
0,9 9,4 4,7 8,8 9,9 2

申请

  sSQL = Join( Array( _
"SELECT E.Num0 - M.Num0 AS Dif0" _
, ", E.Num1 - M.Num1 AS Dif1" _
, ", E.Num2 - M.Num2 AS Dif2" _
, ", E.Num3 - M.Num3 AS Dif3" _
, ", E.Num4 - M.Num4 AS Dif4" _
, ", E.Spot AS Spot" _
, "FROM [expected.txt] AS E" _
, "INNER JOIN [measured.txt] AS M" _
, "ON E.Spot = M.Spot" _
), " " )

将结果集写入differences.txt

aFNames = Array( "Num0", ... "Spot") oFS.CreateTextFile(sFSpec).Write _ Join( aFNames, sFSep ) & sRSep & oRS.GetString( adClipString, , sFSep, sRSep, "")

你得到:

Num0    Num1    Num2    Num3    Num4    Spot
0,5 5 0 0 0 1
0 0 0 0 0 2

关于c++ - Excel 比较两个 csv 文件并显示差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6191708/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com