gpt4 book ai didi

sql-server - Excel vba xml解析性能

转载 作者:行者123 更新时间:2023-12-04 21:22:33 25 4
gpt4 key购买 nike

我正在处理在 excel 中获取一些输入数据,将其解析为 xml 并使用它来运行 SQL 存储过程,但我在 xml 解析时遇到了性能问题。输入表看起来像这样:

Dates_|_Name1_Name2_Name3_..._NameX
Date1 |
Date2 |
. . . |
Date1Y|

我有一些代码可以遍历每个单元格并将数据解析为 xml 字符串,但即使对于大约 300 x 300 的网格,执行也需要大约五分钟的时间,我正在寻找可以使用的数据集有几千列长。我尝试了几件事来帮助加快速度,例如将数据读入 Variant 然后迭代或排除 DoEvents 但我无法加快速度。这是问题所在的代码位:
Dim lastRow As Long
lRows = (oWorkSheet.Cells(Rows.Count, 1).End(xlUp).Row)
Dim lastColumn As Long
lCols = (oWorkSheet.Cells(1, Columns.Count).End(xlToLeft).Column)
Dim sheet As Variant
With Sheets(sName)
sheet = .Range(.Cells(1, 1), .Cells(lRows, lCols))
End With
ReDim nameCols(lCols) As String

...
resultxml = "<DataSet>"
For i = 2 To rows
resultxml = resultxml & "<DateRow>"

For j = 1 To cols
If Trim(sheet(i, j)) <> "" Then
lResult = "<" & nameCols(j) & ">"
rResult = "</" & nameCols(j) & ">"
tmpValue = Trim(sheet(i, j))
If IsDate(tmpValue) And Not IsNumeric(tmpValue) Then
If Len(tmpValue) >= 8 Then
tmpValue = Format(tmpValue, "yyyy-mm-dd")
End If
End If
resultxml = resultxml & lResult & tmpValue & rResult
DoEvents
End If
Next j
resultxml = resultxml & "</DateRow>"
Next i

resultxml = resultxml & "</DataSet>"

任何有关降低运行时间的建议将不胜感激。

最佳答案

考虑使用 MSXML ,一个全面的 W3C 兼容 XML API 库,您可以使用它来使用 DOM 方法( createElementappendChildsetAttribute )而不是连接文本字符串来构建 XML。 XML 不完全是一个文本文件,而是一个具有编码和树结构的标记文件。 Excel 通过引用或后期绑定(bind)配备了 MSXML COM 对象,并且可以从 Excel 数据迭代地构建树,如下所示。

有 300 行 x 12 列的随机日期,下面甚至不需要一分钟(点击宏后的字面意思是几秒钟),它甚至使用嵌入式 XSLT 样式表打印带有换行和缩进的原始输出(如果你不 pretty-print , MSXML 将文档输出为一条长而连续的行)。

输入

Name Date Spreadsheet

VBA (当然与实际数据一致)

Sub xmlExport()
On Error GoTo ErrHandle
' VBA REFERENCE MSXML, v6.0 '
Dim doc As New MSXML2.DOMDocument60, xslDoc As New MSXML2.DOMDocument60, newDoc As New MSXML2.DOMDocument60
Dim root As IXMLDOMElement, dataNode As IXMLDOMElement, datesNode As IXMLDOMElement, namesNode As IXMLDOMElement
Dim i As Long, j As Long
Dim tmpValue As Variant

' DECLARE XML DOC OBJECT '
Set root = doc.createElement("DataSet")
doc.appendChild root

' ITERATE THROUGH ROWS '
For i = 2 To Sheets(1).UsedRange.Rows.Count

' DATA ROW NODE '
Set dataNode = doc.createElement("DataRow")
root.appendChild dataNode

' DATES NODE '
Set datesNode = doc.createElement("Dates")
datesNode.Text = Sheets(1).Range("A" & i)
dataNode.appendChild datesNode

' NAMES NODE '
For j = 1 To 12
tmpValue = Sheets(1).Cells(i, j + 1)
If IsDate(tmpValue) And Not IsNumeric(tmpValue) Then
Set namesNode = doc.createElement("Name" & j)
namesNode.Text = Format(tmpValue, "yyyy-mm-dd")
dataNode.appendChild namesNode
End If
Next j

Next i

' PRETTY PRINT RAW OUTPUT '
xslDoc.LoadXML "<?xml version=" & Chr(34) & "1.0" & Chr(34) & "?>" _
& "<xsl:stylesheet version=" & Chr(34) & "1.0" & Chr(34) _
& " xmlns:xsl=" & Chr(34) & "http://www.w3.org/1999/XSL/Transform" & Chr(34) & ">" _
& "<xsl:strip-space elements=" & Chr(34) & "*" & Chr(34) & " />" _
& "<xsl:output method=" & Chr(34) & "xml" & Chr(34) & " indent=" & Chr(34) & "yes" & Chr(34) & "" _
& " encoding=" & Chr(34) & "UTF-8" & Chr(34) & "/>" _
& " <xsl:template match=" & Chr(34) & "node() | @*" & Chr(34) & ">" _
& " <xsl:copy>" _
& " <xsl:apply-templates select=" & Chr(34) & "node() | @*" & Chr(34) & " />" _
& " </xsl:copy>" _
& " </xsl:template>" _
& "</xsl:stylesheet>"

xslDoc.async = False
doc.transformNodeToObject xslDoc, newDoc
newDoc.Save ActiveWorkbook.Path & "\Output.xml"

MsgBox "Successfully exported Excel data to XML!", vbInformation
Exit Sub

ErrHandle:
MsgBox Err.Number & " - " & Err.Description, vbCritical
Exit Sub

End Sub

输出
<?xml version="1.0" encoding="UTF-8"?>
<DataSet>
<DataRow>
<Dates>Date1</Dates>
<Name1>2016-04-23</Name1>
<Name2>2016-09-22</Name2>
<Name3>2016-09-23</Name3>
<Name4>2016-09-24</Name4>
<Name5>2016-10-31</Name5>
<Name6>2016-09-26</Name6>
<Name7>2016-09-27</Name7>
<Name8>2016-09-28</Name8>
<Name9>2016-09-29</Name9>
<Name10>2016-09-30</Name10>
<Name11>2016-10-01</Name11>
<Name12>2016-10-02</Name12>
</DataRow>
<DataRow>
<Dates>Date2</Dates>
<Name1>2016-06-27</Name1>
<Name2>2016-08-14</Name2>
<Name3>2016-07-08</Name3>
<Name4>2016-08-22</Name4>
<Name5>2016-11-03</Name5>
<Name6>2016-07-28</Name6>
<Name7>2016-08-23</Name7>
<Name8>2016-11-01</Name8>
<Name9>2016-11-01</Name9>
<Name10>2016-08-11</Name10>
<Name11>2016-08-18</Name11>
<Name12>2016-09-23</Name12>
</DataRow>
...

关于sql-server - Excel vba xml解析性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40986395/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com