gpt4 book ai didi

php - 比较数组并搜索匹配值

转载 作者:可可西里 更新时间:2023-10-31 23:41:35 24 4
gpt4 key购买 nike

我有 2 个数组,$arr1$arr2:

$arr1 是我希望从 excel 文件中读取的列的列表,$arr2 是实际找到的列的数组。

有时上传的文件包含

  • 列名拼写错误
  • 不同顺序的列
  • 可能缺少一些列
  • 此外,列名称可能包含不同字符集中的字母(例如,希腊语“M”看起来像拉丁语M,但不能视为相同)。

例如,假设我们有以下 2 个数组:

$arr1 = array('Action', 'LotSize', 'QuantityMinimum', 'SupplierName', 'SPN',
'PartNumExt', 'UOM', 'ListPrice', 'MPN', 'MFrName', 'CatLevel1', 'CatLevel2',
'CatLevel3', 'CatLevel4', 'CatLevel5', 'CatLevel6', 'AcctLevel1', 'AcctLevel2',
'AcctLevel3', 'AcctLevel4', 'AcctLevel5', 'AcctLevel6', 'Desc1', 'Desc2', 'PicName',
'SupplierURL', 'CatPart','TechSpec', 'Kad');

$arr2 = array('Action', 'LotSze', 'QuantityMinimum', 'SupplierName', 'SPN',
'PartNumEx', 'UOM', 'ListPric', 'MPN', 'MfrName', 'CatLevel1', 'CatLevel2',
'CatLevel3', 'CatLevel4', 'AcctLevel1', 'AcctLevel2', 'AcctLevel3', 'AcctLevel4',
'Desc1', 'Desc2', 'PicName', 'SupplierURL', 'CatPart');

我需要比较 2 个数组并将匹配元素的位置保存到第三个数组:

$arr3 = ([0]=>0, [1]=>1, [2]=>3, [3]=>5, [4]=>6, [5]=>...);

显示$arr1的每个匹配元素在$arr2中的位置。

“匹配”是指所有相同的元素(例如 Action)或部分相同的元素(例如 TestTes, ) 以及那些相似但大小写不同的元素(例如 Foo & foo, Bar & bar).

我发布了 this question几天前,我得到了一个很好的答案,但在使用更多示例数据进行了几次测试后,我发现它并不总是按预期工作。

经过更多搜索,我找到了 levenshtein功能,所以我做了一个组合,首先检查完全匹配,如果没有找到,然后尝试找到最接近的匹配。现在,问题是某些列具有相似的名称,例如。 Catlevel1, Catlevel2,...,Catlevel6。因此,如果 Catlevel2 缺失,它将与最后且最相似的列 Catlevel6 匹配。

这是我目前所拥有的:

foreach($all_columns as $i => $val1) {
$result = null;
// Search the second array for an exact match, if found
if(($found = array_search($val1,$_SESSION['found_columns'],true)) !==false) {
$result = $found;
} else {
// Otherwise, see if we can find a case-insensitive matching string
//where the element from $arr2 is found within the one from $arr1
foreach( $_SESSION['found_columns'] as $j => $val2) {
if($val1<>'' && $val2<>'') {
if( stripos( $val1, $val2) !== false ) {
$result = $j;
break;
} else {
$notfound .= $val1.', ';
break;
}
}
}
}
$_SESSION['found_column_positions'][$i] = $result;
}

/*****ALTERNATIVE METHOD USING levenshtein*****/
$i=0;
foreach($all_columns as $key => $value) {
$found = wordMatch($value, $arr2, 2);
$pos = array_search($found, $_SESSION['found_columns']);
$_SESSION['found_column_positions'][$i] = $pos;
$i++;
}

function wordMatch($input, $array, $sensitivity){
$words = $array;
$shortest = -1;
foreach ($words as $word) {
$lev = levenshtein($input, $word);
if ($lev == 0) {
$closest = $word;
$shortest = 0;
break;
}
if ($lev <= $shortest || $shortest < 0) {
$closest = $word;
$shortest = $lev;
}
}
if($shortest <= $sensitivity){
return $closest;
} else {
return 0;
}
}


有没有更好的方法来比较 2 个数组,找到最接近的值匹配并将匹配值键保存到第 3 个数组以用作 2 个数组之间的键引用?

最佳答案

以下脚本将完成这项工作。

<?php
$arr1 = array('Action', 'LotSize', 'QuantityMinimum', 'SupplierName', 'SPN',
'PartNumExt', 'UOM', 'ListPrice', 'MPN', 'MFrName', 'CatLevel1', 'CatLevel2',
'CatLevel3', 'CatLevel4', 'CatLevel5', 'CatLevel6', 'AcctLevel1', 'AcctLevel2',
'AcctLevel3', 'AcctLevel4', 'AcctLevel5', 'AcctLevel6', 'Desc1', 'Desc2', 'PicName',
'SupplierURL', 'CatPart','TechSpec', 'Kad');

$arr2 = array('Action', 'LotSze', 'QuantityMinimum', 'SupplierName', 'SPN',
'PartNumEx', 'UOM', 'ListPric', 'MPN', 'MfrName', 'CatLevel1', 'CatLevel2',
'CatLevel3', 'CatLevel4', 'AcctLevel1', 'AcctLevel2', 'AcctLevel3', 'AcctLevel4',
'Desc1', 'Desc2', 'PicName', 'SupplierURL', 'CatPart');

$arr3 = array();

foreach($arr1 as $key=>$val)
{
$arr3[$key] = array_search($val, $arr2);
}

print_r($arr3);
?>

关于php - 比较数组并搜索匹配值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16463654/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com