- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在开发我的应用程序中的一些功能,这些功能查询我们的数据库并将数据提取到一个数据表,然后打开一个 excel 文件并填充另一个数据表。
因为 excel 文件不包含可用的 ID,所以我无法对数据进行排序,并且可能无法使用 DataTable.Merge()
。
这是我创建的匹配算法的代码。
private void RunMatchingAlgorithm()
{
// Initialize variables
string partNumber = "";
DateTime expiration_date = DateTime.Now;
decimal contract_cost = 0;
string contract_no = "";
string partNumber2 = "";
DateTime expiration_date2 = DateTime.Now;
decimal contract_cost2 = 0;
string contract_no2 = "";
//Get values from DataBase
for (int i = 0; i < dtFromTableContracts.Rows.Count; i++)
{
partNumber2 = dtFromTableContracts.Rows[i]["supplier_part_no"].ToString();
contract_no2 = dtFromTableContracts.Rows[i]["contract_no"].
expiration_date2 = Convert.ToDateTime(dtFromTableContracts.Rows[i]["con_end_date"]).Date;
//Get Values from converted Excel table
for (int j = 0; j < dtConversion.Rows.Count; j++)
{
contract_no = dtConversion.Rows[j]["vend_contract_no"].ToString();
//If we have even a partial match, check for a part number match
if (contract_no2.StartsWith(contract_no))
{
partNumber = dtConversion.Rows[j]["vend_item_id"].ToString();
//If the values match, populate from both tables
if (partNumber == partNumber2)
{
dtConversion.Rows[j]["wpd_expiration_date"] = expiration_date2.Date;
dtConversion.Rows[j]["wpd_cont_cost"] = dtFromTableContracts.Rows[i]["contract_cost"];
dtConversion.Rows[j]["wpd_contract_no"] = dtFromTableContracts.Rows[i]["contract_no"];
dtConversion.Rows[j]["wpd_item_id"] = dtFromTableContracts.Rows[i]["supplier_part_no"];
dtConversion.Rows[j]["wpd_item_no"] = dtFromTableContracts.Rows[i]["item_id"];
dtConversion.Rows[j]["discontinued"] = dtFromTableContracts.Rows[i]["discontinued"];
dtConversion.Rows[j]["job_no"] = dtFromTableContracts.Rows[i]["job_no"];
}
}
}
}
}
如果您好奇的话,后面的方法会删除所有不匹配的行,我们只会在 DGV 中显示匹配的记录。
这目前按预期工作,但如果我的 Big O 表示法是正确的,我正在处理 O(m*n),它在处理较大的数据集时变得相当慢,并且非常占用处理器资源。
我正在寻找一种比遍历每一行更有效的方法来完成此操作,因为我们使用的一些 Excel 电子表格接近 40,000 行。该算法大约需要 6 分钟才能完成该大小的集合。
最佳答案
天哪,代码有很多简化的机会。您可以缩小局部变量的范围,消除为它们分配未使用的值的任何诱惑。当您不使用索引(访问集合除外)时,您还可以将 For 循环转换为 ForEach 循环。
初步简化:
private void RunMatchingAlgorithm() {
foreach (var databaseRow in dtFromTableContracts.Rows) {
string partNumber2 = databaseRow["supplier_part_no"].ToString();
string contract_no2 = databaseRow["contract_no"].ToString();
DateTime expiration_date2 = Convert.ToDateTime(databaseRow["con_end_date"]).Date;
foreach (var excelRow in dtConversion.Rows) {
string contract_no = excelRow["vend_contract_no"].ToString();
//If we have even a partial match, check for a part number match
if (contract_no2.StartsWith(contract_no)) {
string partNumber = excelRow["vend_item_id"].ToString();
//If the values match, populate from both tables
if (partNumber == partNumber2) {
excelRow["wpd_expiration_date"] = expiration_date2.Date;
excelRow["wpd_cont_cost"] = databaseRow["contract_cost"];
excelRow["wpd_contract_no"] = databaseRow["contract_no"];
excelRow["wpd_item_id"] = databaseRow["supplier_part_no"];
excelRow["wpd_item_no"] = databaseRow["item_id"];
excelRow["discontinued"] = databaseRow["discontinued"];
excelRow["job_no"] = databaseRow["job_no"];
}
}
}
}
}
仔细想想,这几乎就是 linq 查询设计的确切案例。我们可以将大部分代码转换为查询:
private void RunMatchingAlgorithm() {
var matches = from databaseRow in dtFromTableContracts.Rows
let partNumber2 = databaseRow["supplier_part_no"].ToString()
let contract_no2 = databaseRow["contract_no"].ToString()
let expiration_date2 = Convert.ToDateTime(databaseRow["con_end_date"]).Date
from excelRow in dtConversion.Rows
let contract_no = excelRow["vend_contract_no"].ToString()
where contract_no2.StartsWith(contract_no)
let partNumber = excelRow["vend_item_id"].ToString()
where partNumber == partNumber2
select new { databaseRow, excelRow, expiration_date2 }
foreach (var m in matches) {
var dst = m.excelRow;
var src = m.databaseRow;
dst["wpd_expiration_date"] = m.expiration_date2.Date;
dst["wpd_cont_cost"] = src["contract_cost"];
dst["wpd_contract_no"] = src["contract_no"];
dst["wpd_item_id"] = src["supplier_part_no"];
dst["wpd_item_no"] = src["item_id"];
dst["discontinued"] = src["discontinued"];
dst["job_no"] = src["job_no"];
}
}
现在我看到了可以应用优化的地方。我们正在做一个带有“where”的嵌套“from”,这相当于一个交叉连接。此外,我们可以削减大部分现在只使用一次的临时文件:
private void RunMatchingAlgorithm() {
var matches = from databaseRow in dtFromTableContracts.Rows
join excelRow in dtConversion.Rows
on excelRow["vend_item_id"].ToString() equals databaseRow["supplier_part_no"].ToString()
where databaseRow["contract_no"].ToString().StartsWith(excelRow["vend_contract_no"].ToString())
select new { databaseRow, excelRow }
foreach (var m in matches) {
var dst = m.excelRow;
var src = m.databaseRow;
dst["wpd_expiration_date"] = Convert.ToDateTime(src["con_end_date"]).Date;
dst["wpd_cont_cost"] = src["contract_cost"];
dst["wpd_contract_no"] = src["contract_no"];
dst["wpd_item_id"] = src["supplier_part_no"];
dst["wpd_item_no"] = src["item_id"];
dst["discontinued"] = src["discontinued"];
dst["job_no"] = src["job_no"];
}
}
我实际上并没有经常使用交叉连接,但我假设他们在后台使用哈希表来实现 O(n+m) 复杂度而不是 O(n*m)。如果两个表都在数据库中,那么数据库可以利用已经构建的哈希表/索引。
您可能还想考虑某种生成的 Linq2SQL 类,这样您就可以对行字段进行类型安全访问。
关于c# - 两个(未排序的)数据表之间匹配的优化算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15209193/
我有一个带有嵌套数据的 angular 数据表,我正在尝试在行点击函数上创建另一个数据表。父数据表的 rowCallBack 函数。 这是我的外部数据表 html; 这是我生成数据表的方
我有一个字母数字列,其中包含诸如“1、2、2”之类的字符串。 当我在搜索中输入“1, 2, 2”时,它似乎返回带有“1,”和“2,”的所有单元格。 我该怎么做才能使搜索仅返回“1、2、2”? 使用数据
我有一个获取其数据服务器端的表,使用自定义服务器端初始化参数,这些参数因生成的报告而异。表格生成后,用户可以打开一个弹出窗口,他们可以在其中添加多个附加过滤器以进行搜索。我需要能够使用与原始表相同的初
在 datatables我希望能够隐藏所有列,但似乎无法正确使用语法。 这来自下面的代码和上面的链接,创建了一个显示所有列的按钮。有没有办法写这个以便我可以隐藏所有列? {
我正在使用 DataTable 创建一个交互式表。我有 9 列,其中 5 列是值。我想根据它们的具体情况更改每个单元格的背景颜色。 我已经开始尝试首先更改整行颜色,因为这似乎是一项更容易的任务。但是我
我有一个简单的例子来说明我的问题。我正在使用数据表 1.9。当数据表位于另一个 html 表内时,水平滚动时列标题不会移动。当它不在 html 表中时它工作正常。我的示例实际上取自他们的水平滚动示例,
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
这是添加按钮以将数据导出到 csv、pdf、excel 的数据表示例...... fiddle here https://datatables.net/extensions/buttons/examp
是否有任何方法可以更改 angularjs 数据表中的按钮样式(colvis、copy、print、excel)。 vm.dtOptions = DTOptionsBuilder.newOptions
我试图弄清楚如何加入 2 个数据表并更新第一个但应用了过滤器。 DT DT2 b c 1: 1 10 2: 2 10 3: 3 10 4: 4 10 5: 5 10 6: 6 10 7: 7 10
我有一个数据表,其中包含许多包含值的列。我还有另一列,它定义了我需要选择哪些列的值。我很难找到一种方法来做到这一点。 这是一个简单的例子。 > d d value.1 value.2 name
我正在使用 data.table 包。我有一个数据表,表示用户在网站上的操作。假设每个用户都可以访问一个网站,并对其执行多项操作。我的原始数据表是 Action (每一行都是一个 Action ),我
我想知道每个变量在每个组中变化了多少次,然后将结果添加到所有组中。 我是这样找到的: mi[,lapply(.SD, function(x) sum(x != shift(x), na.rm=T)
有人可以向我解释一下如何向页眉或页脚添加按钮吗?Datatables 的开发者 Alan 说你必须离开网络服务器才能使用 Table Tools 来使用按钮。但我在独立计算机上离线运行 Datatab
我希望按 id 和按顺序(时间)计算不同的东西。 例如,与: dt = data.table( id=c(1,1,1,2,2,2,3,3,3), hour=c(1,5,5,6,7,8,23,23,23
我正在尝试在 JIRA 小工具中使用数据表,但在我的表准备就绪后,没有可用的分页按钮。我有一个表,我正在以最简单的方式使用数据表:$("#mytableid").dataTable(); 浏览页面元素
我有 responsive 表单中的数据表。 数据表生成 child rows在小型设备上。在这一行中,我有一些输入控件。这会导致两个问题。 第一个问题:**隐藏子行中的值不会进入表单数据。** 第二
我在使用 JQuery DataTable 捕获 keydown 事件时遇到问题。我的目标是允许用户使用箭头键导航表的行。因此,当用户按下箭头键时,我想捕获 keydown 事件并移动表的选定行(这是
是否有任何方法可以以编程方式更改显示的行数,而无需从下拉列表中手动选择? 我已经知道如何更改默认行数。当表首次加载时,我希望它加载所有行,然后“刷新”表以可能仅显示前 10 行。但我想以编程方式刷新表
我有一个数据表,我应该对其进行更改,例如我想更改内容的状态,但该内容位于表的第三页。当我更改它时,数据表会自行刷新到第一页。我想做的是保留选定的页码并在刷新后回调它。这可能吗? 顺便说一句,我正在使用
我是一名优秀的程序员,十分优秀!