gpt4 book ai didi

php - 使用 Instaparse 使用 BNF 解析序列化的 PHP 数据

转载 作者:可可西里 更新时间:2023-11-01 00:46:03 24 4
gpt4 key购买 nike

我有一个由 PHP 序列化的值,我需要在 Clojure 中对其进行解码。我正在使用这个 library反序列化它;它使用 Instaparse它利用 EBNF/ABNF 符号来定义语法。作为引用,这里是完整的定义:

<S> = expr
<expr> = (string | integer | double | boolean | null | array)+
<digit> = #'[0-9]'
<number> = negative* (decimal-num | integer-num)
<negative> = '-'
<integer-num> = digit+
<decimal-num> = integer-num '.' integer-num
<zero-or-one> = '0'|'1'
size = digit+
key = (string | integer)
<val> = expr
array = <'a:'> <size> <':{'> (key val)+ <'}'> <';'>?
boolean = <'b:'> zero-or-one <';'>
null = <'N;'>
integer = <'i:'> number <';'>
double = <'d:'> number <';'>
string = <'s:'> <size> <':\\\"'> #'([^\"]|\\.)*' <'\\\";'>

我在这个库中发现了一个错误 - 它无法处理包含 " 字符的序列化字符串。

php > echo serialize('{"key":"value"}');
s:15:"{"key":"value"}";

使用库反序列化,当它找到第二个 " 时它会爆炸:

> (deserialize-php "s:15:\"{\"key\":\"value\"}\";")
[:index 7]

语法定义的这一行存在问题:

string = <'s:'> <size> <':\\\"'> #'([^\"]|\\.)*' <'\\\";'>

您会注意到字符串定义排除了 " 字符。虽然这是不正确的,但我可以在该字符串中包含任何字符;大小很重要。我不是 BNF 专家,所以我想弄清楚我的选择是什么。

是否可以使用大小作为要抓取的正确字符数?如果那不可能,有人会看到我可以调整语法定义以启用正确解析的方法吗?

最佳答案

作为stated by Arthur Ulfeldt ,这个语法是not context-free due to the bencoded strings .尽管如此,它是一个简单的解析器,只是不使用 A/EBNF。例如,使用 Parse-EZ 改为:

一个方便的宏:

(defmacro tagged-sphp-expr [tag parser] 
`(fn [] (between #(string ~(str tag ":")) #(~parser) #(string ";"))))

其余的:

(def sphp-integer (tagged-sphp-expr "i" integer))

(def sphp-decimal (tagged-sphp-expr "d" decimal))

(defn sphp-boolean []
(= \1 ((tagged-sphp-expr "b" #(chr-in "01")))))

(defn sphp-null [] (string "N;") :null)

(defn sphp-string []
(let [tag (string "s:")
size (integer)
open (no-trim #(string ":\""))
contents (read-n size)
close (string "\";")]
contents))

(declare sphp-array)

(defn sphp-expr []
(any #(sphp-integer) #(sphp-decimal) #(sphp-boolean) #(sphp-null) #(sphp-string) #(sphp-array)))

(defn sphp-key []
(any #(sphp-string) #(sphp-integer)))

(defn sphp-kv-pair []
(apply array-map (series #(sphp-key) #(sphp-expr))))

(defn sphp-array []
(let [size (between #(string "a:") #(integer) #(string ":{"))
contents (times size sphp-kv-pair)]
(chr \})
(attempt #(chr \;))
contents))

测试:

(def test-str "i:1;d:2;s:16:\"{\"key\": \"value\"}\";a:2:{s:3:\"php\";s:3:\"sux\";s:3:\"clj\";s:3:\"rox\";};b:1;")

(println test-str)
;=> i:1;d:2;s:16:"{"key": "value"}";a:2:{s:3:"php";s:3:"sux";s:3:"clj";s:3:"rox";};b:1;

(parse #(multi* sphp-expr) test-str)
;=> [1 2.0 "{\"key\": \"value\"}" [{"php" "sux"} {"clj" "rox"}] true]

关于php - 使用 Instaparse 使用 BNF 解析序列化的 PHP 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18518499/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com