- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我读过efficiency guide和 erlang-questions mailing list archive &Erlang 中所有可用的书籍。但我还没有找到高效的准确描述二进制模式匹配。虽然,我还没有阅读来源:)但我希望已经阅读过它们的人会阅读这篇文章。这是我的问题。
erlang 二进制文件有多少个匹配上下文?
a) 如果我们按顺序匹配二进制文件的各个部分并且仅匹配一次
A = <<1,2,3,4>>.
<<A1,A2,A3,A4>> = A.
我们只有一个二元匹配上下文(从 A 的开头移动到结尾),还是四个?
b) 如果我们第一次从头到尾按顺序匹配二进制文件的各个部分并且(再次依次)第二次从头到尾
B = <<1,2,3,4>>.
<<B1,B2,B3,B4>> = B.
<<B11,B22,B33,B44>> = B.
我们是否只有一个匹配上下文,从 B 的开头移动到结尾B,然后再次从 B 的开头移动到 B 的结尾,
或
我们有 2 个匹配上下文,一个是从 B 的开头移动到 B 的结尾,另一个 - 再次从 B 的开头到 B 的结尾(因为第一个不能移动再次回到开头)
或者我们有 8 个匹配上下文?
根据documentation ,如果我写:
my_binary_to_list(<<H,T/binary>>) ->
[H|my_binary_to_list(T)];
my_binary_to_list(<<>>) -> [].
整个递归树只有 1 个匹配上下文,尽管如此函数不是尾递归的。
a) 我是否理解正确,在这种情况下只有 1 个匹配上下文?
b) 我说得对吗,如果我按顺序匹配一个 erlang 二进制文件(从开始到end),使用哪种递归类型(tail或body)并不重要?(从二进制匹配效率的角度来看)
c) 如果我要不按顺序处理 erlang 二进制文件,比如说,我正在穿越,该怎么办二进制 - 首先我匹配第一个字节,然后匹配第 1000 个字节,然后匹配第 5 个字节,然后匹配第 10001 个字节,然后匹配第 10 个字节...
在这种情况下,
d1) 如果我使用 body-recursion,我会有多少个该二进制文件的匹配上下文 -一或 >1?
d2) 如果我使用尾递归,这个二进制文件会有多少个匹配上下文 -一或 >1?
如果我通过尾递归传递一个大的二进制文件(比如 1 MB),所有 1 MB 的数据都会被复制吗?或者只有某种指向该二进制文件开头的指针在调用之间传递?
我匹配哪个二进制文件(大或小)重要吗?将为任何大小的二进制文件创建匹配上下文,还是只为大的二进制文件创建匹配上下文?
最佳答案
我只是 erlang 的初学者,所以对这个答案持保留态度。
How many match contexts does an erlang binary have?
a) 仅创建一个上下文,但在该实例中它被完全消耗,因为没有任何内容可以匹配,因此它可能无法重用。
b) 同样,整个二进制文件被分割,匹配后没有留下任何上下文,尽管已经为每一行创建了一个上下文:从 B1
到 B4
的赋值code> 创建一个上下文,从 B11
到 B44
的第二组赋值也创建一个上下文。因此,我们总共创建并使用了 2 个上下文。
According to documentation [...]
这一部分对我来说也不太清楚,但这是我能弄清楚的。
a) 是的,在函数递归执行的整个过程中只会分配一个上下文。
b)实际上没有提到区分尾递归与非尾递归。然而,给出的示例显然是一个可以转换(尽管它并不简单)为尾递归函数的函数。我认为当一个子句包含多个供上下文遵循的路径时,编译器决定复制匹配的上下文。在这种情况下,编译器检测到该函数是尾部可优化的,并且不进行分配。
c)我们在您复制的示例中看到相反的情况发生,其中包含一个 case 表达式:在那里,上下文可能遵循 2 个不同的路径,因此编译器必须在每个递归级别强制分配.
If I pass a large binary (say 1 megabyte) via tail recursion [...]
来自第 4.1 节:
A sub binary is created by split_binary/2 and when a binary is matched out in a binary pattern. A sub binary is a reference into a part of another binary (refc or heap binary, never into a another sub binary). Therefore, matching out a binary is relatively cheap because the actual binary data is never copied.
在处理二进制文件时,缓冲区用于存储实际数据,任何匹配的子部分都被实现为包含指向原始缓冲区的指针的结构,加上偏移量和指示哪个子部分正在被处理的长度经过考虑的。这就是文档中提到的子二进制类型。
我匹配哪个二进制文件重要吗 - 大还是小 - ...
来自相同的§ 4.1:
The binary containers are called refc binaries (short for reference-counted binaries) and heap binaries.
Refc binaries consist of two parts: an object stored on the process heap, called a ProcBin, and the binary object itself stored outside all process heaps.
[...]
Heap binaries are small binaries, up to 64 bytes, that are stored directly on the process heap. They will be copied when the process is garbage collected and when they are sent as a message. They don't require any special handling by the garbage collector.
这表明,根据二进制文件的大小,它可能会存储为进程外部的大缓冲区,并通过代理结构在进程中引用,或者如果该二进制文件小于 64 字节,它将直接存储在处理它的进程内存中。第一种情况可以避免在共享二进制文件的进程在同一节点上运行时复制二进制文件。
关于erlang - 需要澄清 erlang 位串的匹配上下文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24048396/
使用sed和/或awk,仅在行包含字符串“ foo”并且行之前和之后的行分别包含字符串“ bar”和“ baz”时,我才希望删除行。 因此,对于此输入: blah blah foo blah bar
例如: S1: "some filename contains few words.txt" S2:“一些文件名包含几个单词 - draft.txt” S3:“一些文件名包含几个单词 - 另一个 dr
我正在尝试处理一些非常困惑的数据。我需要通过样本 ID 合并两个包含不同类型数据的大数据框。问题是一张表的样本 ID 有许多不同的格式,但大多数都包含用于匹配其 ID 中某处所需的 ID 字符串,例如
我想在匹配特定屏幕尺寸时显示特定图像。在这种情况下,对于 Bootstrap ,我使用 col-xx-## 作为我的选择。但似乎它并没有真正按照我认为应该的方式工作。 基本思路,我想显示一种全屏图像,
出于某种原因,这条规则 RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^(.*
我想做类似的东西(Nemerle 语法) def something = match(STT) | 1 with st= "Summ" | 2 with st= "AVG" =>
假设这是我的代码 var str="abc=1234587;abc=19855284;abc=1234587;abc=19855284;abc=1234587;abc=19855284;abc=123
我怎样才能得到这个字符串的数字:'(31.5393701, -82.46235569999999)' 我已经在尝试了,但这离解决方案还很远:) text.match(/\((\d+),(\d+)\)/
如何去除输出中的逗号 (,)?有没有更好的方法从字符串或句子中搜索 url。 alert(" http://www.cnn.com df".match(/https?:\/\/([-\w\.]+
a = ('one', 'two') b = ('ten', 'ten') z = [('four', 'five', 'six'), ('one', 'two', 'twenty')] 我正在尝试
我已经编写了以下代码,我希望用它来查找从第 21 列到另一张表中最后一行的值,并根据这张表中 A 列和另一张表中 B 列中的值将它们返回到这张表床单。 当我使用下面的代码时,我得到一个工作表错误。你能
我在以下结构中有两列 A B 1 49 4922039670 我已经能够评估 =LEN(A1)如2 , =LEFT(B1,2)如49 , 和 =LEFT(B1,LEN(A1)
我有一个文件,其中一行可以以 + 开头, -或 * .在其中一些行之间可以有以字母或数字(一般文本)开头的行(也包含这些字符,但不在第 1 列中!)。 知道这一点,设置匹配和突出显示机制的最简单方法是
我有一个数据字段文件,其中可能包含注释,如下所示: id, data, data, data 101 a, b, c 102 d, e, f 103 g, h, i // has to do with
我有以下模式:/^\/(?P.+)$/匹配:/url . 我的问题是它也匹配 /url/page ,如何忽略/在这个正则表达式中? 该模式应该: 模式匹配:/url 模式不匹配:/url/page 提
我有一个非常庞大且复杂的数据集,其中包含许多对公司的观察。公司的一些观察是多余的,我需要制作一个键来将多余的观察映射到一个单独的观察。然而,判断他们是否真的代表同一家公司的唯一方法是通过各种变量的相似
我有以下 XML A B C 我想查找 if not(exists(//Record/subRecord
我制作了一个正则表达式来验证潜在的比特币地址,现在当我单击报价按钮时,我希望根据正则表达式检查表单中输入的值,但它不起作用。 https://jsfiddle.net/arkqdc8a/5/ var
我有一些 MS Word 文档,我已将其全部内容转移到 SQL 表中。 内容包含多个方括号和大括号,例如 [{a} as at [b],] {c,} {d,} etc 我需要进行检查以确保括号平衡/匹
我正在使用 Node.js 从 XML 文件读取数据。但是当我尝试将文件中的数据与文字进行比较时,它不匹配,即使它看起来相同: const parser: xml2js.Parser = new
我是一名优秀的程序员,十分优秀!