- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在寻找各种(更好的)方法来解析 PHP 中的结构化文本数据并将该数据放入 PHP 对象图中。我在 PHP 中看到过许多针对各种基于文本的文件格式的不同解析器,但几乎所有这些解析器似乎都是一些脆弱的正则表达式链。一定有更好的方法!
在这种特定情况下,我希望解析 MT940 文件(银行账户交易)。但是我也遇到了其他文件格式的同样问题。我总是以一大串正则表达式而告终,这些正则表达式变得难以维护,尤其是当需要支持不同的格式时。 MT940也有这个问题。 MT940 不是严格定义的格式,几乎所有银行都使用略有不同的方言。
那么,您如何设计更健壮和可扩展的解析器来处理不同的方言?
这是一个示例 MT940 语句,取自 this question :
{1:F01AHHBCH110XXX0000000000}{2:I940X N2}{3:{108:XBS/091502}}{4:
:20:XBS/091202/0001
:25:5887/507004-50
:28C:140/1
:60F:C0914CHF7789,
:61:0912021202D36,80NTRFNONREF//0887-1202-29-941
04392579-0 LUTHY + xxx, ZUR
:86:6034?60LUTHY + xxxx, ZUR vom 01.12.09 um 16:28 Karten-Nr. 2232
2579-0
:62F:C091202CHF52,2
:64:C091302CHF52,2
-}
最佳答案
class Mt940{
private $controler = null;
private $content = null;
private $transItem = array();
private $transCount = 0;
private $operationItem = array();
private $operationCount = 0;
private $details = array();
public function __construct(\app\library\_PajaxController $controler)
{
$this->controler = $controler;
}
public function load($file_path, $encodingIn='', $encodingOut='')
{
try{
if(!file_exists($file_path)) throw new \app\library\_PajaxException("File not found!", \app\library\_PajaxException::TEXT, $this->controler->getEnv() );
$this->transItem = array();
$this->transCount = 0;
$this->operationItem = array();
$this->operationCount = 0;
$this->content = file_get_contents($file_path);
if($encodingIn != '' && $encodingOut != '' ) $this->content = @iconv($encodingIn, $encodingOut, $this->content);
$this->splitTransfers();
$this->to_details();
$this->parse();
return $this->details;
}catch(\app\library\_PajaxException $ex)
{
throw $ex;
}catch(\Throwable $thr) { throw new \app\library\_PajaxException($thr, \app\library\_PajaxException::THROWABLE, $this->getEnv()); }
}
private function splitTransfers()
{
try{
$contTmp = $this->content;
$offsetStr = 0;
while(true)
{
$intStr20 = strpos( $contTmp,':20:', $offsetStr);
$intStr62F = -1;
$iniStrEnd = -1;
if( is_numeric($intStr20) && $intStr20 >= 0) //found start transaction..
{
//try find end..
$intStr62F = strpos( $contTmp,':62F:', $intStr20);
//echo $intStr20.' -- > '.$intStr62F;
if( is_numeric($intStr62F) && $intStr62F >= 0)
{
$iniStrEnd = strpos( $contTmp,"\r\n", $intStr62F);
$items = substr( $contTmp ,$intStr20, $iniStrEnd - $intStr20 );
$this->transItem[$this->transCount] = $items;
$this->transCount++;
$offsetStr = $iniStrEnd+2;
}
}else break;
}
//print_r($this->transItem);
}catch(\app\library\_PajaxException $ex)
{
throw $ex;
}catch(\Throwable $thr) { throw new \app\library\_PajaxException($thr, \app\library\_PajaxException::THROWABLE, $this->getEnv()); }
}
private function to_details()
{
try{
foreach ($this->transItem as $ix => $trans)
{
// echo $trans."\n\n\n";
$offsetStr = 0;
while(true)
{
$intStr61 = strpos( $trans,':61:', $offsetStr);
$iniStrEnd = -1;
if( is_numeric($intStr61) && $intStr61 >= 0) //found start transaction..
{
//try find end..
$intStrEndStr = strpos( $trans,':61:', $intStr61+4); //nex trans
$intStrEndStr2 = strpos( $trans,':62F:', $intStr61); //nex trans
// echo "\n".$intStr61." -->> ".$iniStrEnd."\n";
// echo "\n".$intStr61." -->> ".$intStrEndStr2."\n";
if( is_numeric($intStrEndStr) && $intStrEndStr >= 0)
{
$item = substr($trans, $intStr61, $intStrEndStr-$intStr61-4);
// echo "\n{".$item."\n}\n";
$this->operationItem[$this->operationCount] = $item;
$this->operationCount++;
$offsetStr = $intStrEndStr-4;
continue;
}else
if( is_numeric($intStrEndStr2) && $intStrEndStr2 >= 0)
{
$item = substr($trans, $intStr61, $intStrEndStr2-$intStr61-4);
// echo "\n3\{\n".$item."\n}\n";
$this->operationItem[$this->operationCount] = $item;
$this->operationCount++;
$offsetStr = $intStrEndStr2-4;
continue;
}else break;
}else break;
}
// echo "\n---------\n";
}
}catch(\app\library\_PajaxException $ex)
{
throw $ex;
}catch(\Throwable $thr) { throw new \app\library\_PajaxException($thr, \app\library\_PajaxException::THROWABLE, $this->getEnv()); }
}
/**
*
* @throws \app\library\_PajaxException
*/
private function parse()
{
try{
foreach ($this->operationItem as $ix => $trans)
{
// echo "\n".$trans."\n";
$trans = str_replace("\r\n", "", $trans);
$int61 = strpos($trans, ":61:");
$int86 = strpos($trans, ":86:", $int61);
if(is_numeric($int61) && is_numeric($int86) )
{
$str61 = substr($trans, $int61+4, $int86 - $int61-2) ;
$str86 = substr($trans, $int86+4);
// echo "\n[".$str61."]\n";
// echo "\n[".$str86."]\n";
$currencyDate = substr($str61, 0,6); //YYMMDD
$approveDate = substr($str61, 6, 4); //MMDD
$accPage = substr($str61,10, 2); //CN/CD etc.
$amPos = strpos($str61, ",",12);
$amount = ( substr($str61, 12, $amPos-12+3) );
$amount = str_replace(",", ".",$amount);
$amount = number_format($amount,2,'.','');
$exp = explode("^", $str86);
if(count($exp) < 2) $exp = explode(">", $str86);
if(count($exp) < 2) $exp = explode("<", $str86);
if(count($exp) < 2) $exp = explode("&", $str86);
if(count($exp) < 2) $exp = explode("*", $str86);
if(count($exp) < 2) $exp = explode(":", $str86);
$cl_name = '';
$title = '';
$unique = '';
if(count($exp)>0) $title .= $exp[0].' ';
if(count($exp)>1) $title .= $exp[1].' ';
if(count($exp)>2) $cl_name .= $exp[2].' ';
if(count($exp)>3) $cl_name .= $exp[3].' ';
if(count($exp)>4) $cl_name .= $exp[4].' ';
if(count($exp)>5) $cl_name .= $exp[5].' ';
foreach($exp as $xi => $ex_row) $unique .= $ex_row;
$unique = md5($unique);
// echo "\n[".$currencyDate.' | '.$approveDate.' | '.$accPage .' | '.$amount." | ".$title." | ".$cl_name." | ".$unique."]\n";
// echo "\n \n";
$this->details[] = array(
'unique' => $unique,
'amount' => $amount,
'currencyDate' => $currencyDate,
'approveDate' => $approveDate,
'title' => $title,
'name' => $cl_name,
);
}
}
}catch(\app\library\_PajaxException $ex)
{
throw $ex;
}catch(\Throwable $thr) { throw new \app\library\_PajaxException($thr, \app\library\_PajaxException::THROWABLE, $this->getEnv()); }
}
}
关于php - 在 PHP 中解析结构化文本数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9711363/
表架构 DROP TABLE bla; CREATE TABLE bla (id INTEGER, city INTEGER, year_ INTEGER, month_ INTEGER, val I
我需要拆分字符串/或从具有以下结构的字符串中获取更容易的子字符串。 字符串将来自 window.location.pathname 或 window.location.href,看起来像 text/n
每当将对象添加到数组中时,我都会尝试更新 TextView ,并在 TextView 中显示该文本,如下所示: "object 1" "object 2" 问题是,每次将新对象添加到数组时,它都会覆盖
我目前正在寻找使用 Java 读取网站可见文本并将其存储为纯文本字符串的方法。 换句话说,我想转换成这样: Hello stupid World进入“ Hello World ” 或者类似的东西 Un
我正在尝试以文本和 HTML 格式发送电子邮件,但无法正确发送正确的 header 。特别是,我想设置 Content-Type header ,但我找不到如何为 html 和文本部分单独设置它。 这
我尝试了上面的代码,但我无法绑定(bind)文本,我怎样才能将资源内部文本 bloc
我刚刚完成了 Space Shooter 教程,由于没有 GUIText 对象,所以我创建了 UI.Text 对象并进行了相应的编码。它在统一播放器中有效,但在构建 Web 应用程序后无效。我花了一段
我有这个代码: - (IBAction)setButtonPressed:(id)sender { NSUserDefaults *sharedDefaults = [[NSUserDefau
抱歉标题含糊不清,但我想不出我想在标题中做什么。无论如何,对于图像上的文本,我使用了 JLabel 文本并将其添加到图标中。 JLabel icon = new JLabel(new Imag
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
我在将 Twitter 嵌入到我从 HTML 5 转换的 wordpress 运行网站时遇到问题。 我遇到的问题是推文不是我的自定义字体... 这是我无法使用任何 css 定位的 HTML 代码,我正
我正在尝试找到解决由于使用以下形式的代码而导致的冗余字符串连接问题的最佳方法: logger.debug("Entering loop, arg is: " + arg) // @1 在大多数情况下,
我写了这个测试 @Test public void removeRequestTextFromRouteError() throws Exception { String input = "F
我目前正在创建一个正则表达式来拆分所有匹配以下格式的字符串:&[文本],并且需要获取文本。字符串可能类似于:something &[text] &[text] everything &[text] 等
有没有办法将标题文本从一个词变形为另一个词,同时保留两个词中使用的字母?我看过的许多 css 文本动画大多是视觉的,很少有旋转整个单词的。 我想要做的是从一个词过渡,例如“BEACH”到“CHANGE
总结matplotlib绘图如何设置坐标轴刻度大小和刻度。 上代码: ?
我在容器 (1) 中创建了容器 (2)。你能帮忙如何向容器(1)添加文本吗?下面是我的代码 return Scaffold( body: Padding( padding: c
我似乎找不到任何人或任何人这样做过。我试图限制我们使用的图像数量,并想创建一个带有渐变作为其“颜色”的文本,并在其周围设置渐变轮廓/描边 到目前为止,我还没有看到任何将两者结合在一起的东西。 我可以自
我正在为视频游戏暗黑破坏神 2 使用 discord.py 构建一个不和谐机器人。其中一项功能要求机器人从暗黑破坏神 2 屏幕截图中提取项目的名称和属性。我目前正在为此使用 pytesseract,但
我很难弄清楚如何旋转 strip.text theme 中的属性来自 ggplot2 .我使用的是 R 版本 3.4.2 和 ggplot2 版本 2.2.1。 以下是 MWE 的数据。 > dput
我是一名优秀的程序员,十分优秀!