gpt4 book ai didi

c# - List<[]> 中的 Excel 数据输入速度很慢,是否有更好的算法设计?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:43:53 25 4
gpt4 key购买 nike

我有一个算法可以获取数组列表并将它们输入到 Excel 文件中,但是它非常慢。这个算法有没有更好的设计?

public void WriteToExcel(List<string[]> parsedData, string path, string fileName)
{
// Get the Excel application object.
Excel.Application xlApp = new Excel.Application();

// Make Excel visible.
xlApp.Visible = true;

Excel.Workbook workbook = xlApp.Workbooks.Add(Excel.XlWBATemplate.xlWBATWorksheet);
Excel.Worksheet sheet = (Excel.Worksheet)xlApp.Worksheets[1];
sheet.Select(Type.Missing);
//Loop through arrays in parsedData list.
for (var lstElement=0;lstElement<parsedData.Count;lstElement++)
{
//Loop through array.
for(var arryElement = 0; arryElement<parsedData[lstElement].Count(); arryElement++)
{
sheet.Cells[lstElement + 1, arryElement + 1] = parsedData[lstElement][arryElement];
}
}
// Save the changes and close the workbook.
workbook.Close(true, fileName, Type.Missing);

// Close the Excel server.
xlApp.Quit();

}

最佳答案

使用 Office 互操作时,最慢的部分是进程间调用,它会在您访问自动化类/接口(interface)的某些属性或方法时发生。

因此优化目标应该是最小化往返(进程间调用)。

在您的特定用例中,不是逐个单元格设置值(即进行大量调用),幸运的是,有一种方法可以通过传递值数组一次调用来设置整个 Excel 范围的值。根据包含您的数据的列数,以下修改应该会给您带来显着的加速。

重要部分:

//Loop through arrays in parsedData list.
int row = 1, column = 1;
object[] values = null; // buffer - see below. Avoids unnecessary allocations.
for (var lstElement = 0; lstElement < parsedData.Count; lstElement++)
{
var data = parsedData[lstElement];
if (data == null || data.Length == 0) continue;
if (data.Length == 1)
{
// Single cell
sheet.Cells[row, column] = data[0];
}
else
{
// Cell range
var range = sheet.Range[CellName(row, column), CellName(row, column + data.Length - 1)];
// We can pass the data array directly, but since it's a string[], Excel will treat them as text.
// The trick is to to pass them via object[].
if (values == null || values.Length != data.Length)
values = new object[data.Length];
for (int i = 0; i < data.Length; i++)
values[i] = data[i];
// Set all values in a single roundtrip
range.Value2 = values;
}
row++;
}

使用的助手:

static string CellName(int row, int column)
{
return ColumnName(column) + row;
}

static string ColumnName(int column)
{
const int StartLetter = 'A', EndLetter = 'Z', LetterCount = EndLetter - StartLetter + 1;
int index = column - 1;
var letter = (char)(StartLetter + (index % LetterCount));
if (index < LetterCount) return letter.ToString();
var firstLetter = (char)(StartLetter + index / LetterCount - 1);
return new string(new [] { firstLetter, letter });
}

一旦你明白了,你可以通过扩展上面的内容来处理像这样的多行范围来获得更好的性能(在这种情况下最重要的是使用二维数组作为值):

const int MaxCells = 1 * 1024 * 1024; // Arbitrary
var maxColumns = parsedData.Max(data => data.Length);
var maxRows = Math.Min(parsedData.Count, MaxCells / maxColumns);
object[,] values = null;
int row = 1, column = 1;
for (int lstElement = 0; lstElement < parsedData.Count; )
{
int rowCount = Math.Min(maxRows, parsedData.Count - lstElement);
if (values == null || values.GetLength(0) != rowCount)
values = new object[rowCount, maxColumns];
for (int r = 0; r < rowCount; r++)
{
var data = parsedData[lstElement++];
for (int c = 0; c < data.Length; c++)
values[r, c] = data[c];
}
var range = sheet.Range[CellName(row, column), CellName(row + rowCount - 1, column + maxColumns - 1)];
range.Value2 = values;
row += rowCount;
}

关于c# - List<[]> 中的 Excel 数据输入速度很慢,是否有更好的算法设计?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35352783/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com