- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在关注this论文实现和注意力池网络构建问答系统。在2.1章中,谈到了CNN层:
其中 q_emb
是一个问题,其中每个标记(单词)都是使用 word2vec 嵌入的。 q_emb
的形状为 (d, M)
。 d
是词嵌入的维度,M
是问题的长度。类似地,a_emb
是形状为 (d, L)
的答案的嵌入。我的问题是:卷积是如何完成的以及两个操作的 W_1
和 b_1
怎么可能相同?在我看来,至少 b_1
在每种情况下都应该有不同的维度(它应该是一个矩阵,而不是一个向量......)。
目前我已经在 PyTorch 中实现了此操作:
### Input is a tensor of shape (batch_size, 1, M or L, d*k)
conv2 = nn.Conv2d(1, c, (d*k, 1))
最佳答案
我发现这篇论文的作者相信读者能够在这里假设/弄清楚很多事情。根据我的阅读,我可以收集到以下内容:
W1
应该是 1 X dk
矩阵,因为这是获得 Q
作为 的唯一有意义的形状>c X M
矩阵。b1
不必是矩阵。从上面,你可以得到一个 c X 1 X M
矩阵,它可以很容易地 reshape 为 c X M
矩阵,并且 b1
可以是一个 c X 1
向量可以被广播并添加到矩阵的其余部分。由于 c
、d
和 k
是超参数,因此您可以轻松拥有相同的 W1
和b1
适用于 Q
和 A
。
这就是我目前的想法,如果有什么问题我会重新阅读和编辑。
关于matrix - 实现注意力池网络问答的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52531615/
I'm posting this in Q&A style as there are currently a few posts on S/O with similar questions and a
我正在尝试做一些我认为非常简单的事情——传递一个队列和一个函数,并将该函数应用于队列中的每个项目——但我无法编译它。 class Foo { public: void doStuff();
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 5 年前。 Improve th
我的密码使用的是 sha512,但 secret 问题和答案是纯文本。问题是:我需要散列 secret 答案吗?如果是这样,它使用什么数据类型,它仍然是 char(128) 吗?我假设 secret
以前是否有人使用 Freebase 作为知识库在问答机上做过任何工作?我在网上搜索了这个,但没有得到任何实质性的东西。有谁知道在输入非结构化问题并且 QA 引擎利用 Freebase 提供答案的这个领
以前是否有人使用 Freebase 作为知识库在问答机上做过任何工作?我在网上搜索了这个,但没有得到任何实质性的东西。有谁知道在输入非结构化问题并且 QA 引擎利用 Freebase 提供答案的这个领
我正在尝试编写一个您自己的时区转换器,我需要一种方法来确定该月的最后一天可能是哪一天。经过一些研究,我发现了寻找闰年的公式。 这是一个很小的贡献,但也许我会为其他人节省我花 20 分钟弄清楚并应用它的
我有一个 Azure Function(不在容器中)。 当我将其发布到本地 Azure 时,就可以了。 当我从 Azure Devops 发布它时,部署成功,但该函数无法运行。错误“Azure 函数运
当 __getitem__ 映射到内部序列类型时,以下哪一项是推荐的执行方式? class A: def __init__(self, ...): ... se
如何在我的 ng2 应用程序中使用预处理器?我正在使用 angular-cli 和 the original docs对我来说还不够清楚。此外,我想在全局范围内使用这些样式,而不仅仅是在组件范围内。
StackO 的 friend 们大家好。 最后一天,我研究了一种解决方案,将不同表中的特定值导出到一个 XML 文件中。主要问题:我有三层嵌套表。由于我在编写这些函数时遇到了问题,因此我想与您分享我
这是一个问答,这意味着我正在分享我对我遇到的问题的解决方案/答案: 问题是 getting started guide来自 apache 站点的并不完全是最新的,经过一些摆弄之后,我设法让示例工作。
我是一名优秀的程序员,十分优秀!