deep-learning - 使用 TorchText (PyTorch) 进行语言翻译-6ren

deep-learning - 使用 TorchText (PyTorch) 进行语言翻译

转载作者：行者123 更新时间：2023-12-04 10:49:26

24

4

我最近开始使用 PyTorch 进行 ML/DL。以下 pytorch 示例说明了我们如何训练一个简单的模型来将德语翻译成英语。

https://pytorch.org/tutorials/beginner/torchtext_translation_tutorial.html

但是，我对如何使用模型对自定义输入运行推理感到困惑。从我目前的理解来看:

1) 我们需要为德语(输入)和英语(输出)[使用 torch.save()] 保存“词汇”，以便以后可以使用它们进行预测。

2) 在对德语段落进行推理时，我们首先需要使用德语 vocab 文件将德语文本转换为张量。

3)上面的张量会传递给模型的forward方法进行翻译

4)模型将再次返回目标语言的张量，即当前示例中的英语。

5) 我们将使用第一步保存的英文词汇将这个张量转换回英文文本。

问题:

1)如果上述理解是正确的，如果我们知道源语言和目标语言并且有相同的词汇文件，上述步骤是否可以被视为在任何语言翻译模型上运行推理的通用方法？或者我们可以使用spacy等第三方库提供的词汇吗？

2)我们如何将模型返回的输出张量转换回目标语言？我找不到任何关于如何做到这一点的例子。上面的博客解释了如何使用源语言词汇将输入文本转换为张量。

我可以很容易地找到图像/视觉模型的各种示例和详细解释，但对于文本则不多。

最佳答案

是的，全局范围内您所说的都是正确的，当然您可以使用任何词汇，例如由 spacy 提供。要将张量转换为自然文本，最常用的方法之一是保留将索引映射到单词的字典和将单词映射到索引的另一个字典，以下代码可以执行此操作:

tok2idx = defaultdict(lambda: 0)
idx2tok = {}

for seq in sequences:
    for tok in seq:
        if not tok in tok2idx:
            tok2idx[tok] = index
            idx2tok[index] = tok
            index += 1

这里的序列是所有序列的列表(即数据集中的句子)。如果您只有一个单词或标记列表，则可以通过仅保留内部循环轻松更改模型。

关于deep-learning - 使用 TorchText (PyTorch) 进行语言翻译，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59549980/

24

4

0

文章推荐： python - cosine_similarity 2 pandas df 列之间的余弦距离

文章推荐： javascript - 带有 javascript 的 Ajax 无法在 wamp 服务器上运行

文章推荐： java - 如何打破和继续？

文章推荐： c - C 如何处理包含空字符的多字节字符？

【翻译】rocksdbwritestall
翻译自官方wiki： https://github.com/facebook/rocksdb/wiki/Write-Stalls 转载请注明出处： https://www.cnblogs.c
翻译：REST和gRPC详细比较
译者注：在微服务架构设计，构建API和服务间通信技术选型时，对 REST 和 gRPC 的理解和应用还存在知识盲区，近期看到国外的这篇文章： A detailed comparison of
【翻译】rocksdb调试指引
rocksdb调试指引翻译自官方wiki: https://github.com/facebook/rocksdb/wiki/RocksDB-Tuning-Guide 转载请注明出处： h
浅谈MVC框架的优点(翻译)
传统的ASP.NET Web Forms是一个非常好的主意，但现实需求非常复杂。随着时间的推移，现实世界的项目暴露出Web Forms的一些不足之处： “沉重的”视图状态：现实中在http请求之间
十个最常见的Java字符串问题(翻译)
翻译自：Top 10 questions of Java Strings 简单地说，”==”测试两个字符串的引用是否相同，equals()测试两个字符串的值是否相同。除非你希望检
理解Java当中的回调机制(翻译)
你好，今天我要和大家分享一些东西，举例来说这个在JavaScript中用的很多。我要讲讲回调（callbacks）。你知道什么时候用，怎么用这个吗？你真的理解了它在java环境中的用法了吗？当我也问
JAVA多线程和并发基础面试问答(翻译)
　Java多线程面试问题　　1. 进程和线程之间有什么不同？　　一个进程是一个独立(self contained)的运行环境，它可以被看作一个程序或者一个应用。而线程是在进程中执行的一个
[翻译].NET8的原生AOT及高性能Web开发中的应用[附性能测试结果]
原文: [A Dive into .Net 8 Native AOT and Efficient Web Development] 作者: [sharmila subbiah] 引言随着 .NE
angularjs - Angular 翻译
这是Fiddle 是否可以在 angular-translate 中检查其他语言的键值是否可用，然后它可以从其他语言中提取该键值？就像在示例中，我有英语和西类牙语。并且一个键值(例如“CONFIRM
外部脚本中的 Magento 翻译
我希望能够使用 $this->__('String to translate')在外部脚本中。我该怎么做呢？ Magento 版本 1.5.1.0 . 最佳答案我认为设置语言环境的正确方法是: Ma
自定义属性的 Angular 翻译
我有一个开关小部件，它使用自定义数据属性值来标记自己。 .switch.switch-text .switch-label::before { right: 1px; color: #c2cf
java - 翻译 LOC
是否有人遇到过这样的情况:用 Java 编写并由(例如)法国程序员编写的现有代码库必须转换为英语程序员可以理解的代码？这里的问题是变量/方法/类名称、注释等都将采用该特定语言。现在有可用的自动化解决
java - java解释器在逐行执行代码之前是否执行转换/翻译？
维基百科和其他一些网站将解释器描述为将代码从某种高级语言翻译成某种低级语言的翻译器。然而，有很多解释，包括在 stackoverflow 中，它说解释器直接执行作为输入的指令，而无需事先转换。那么解释
image - 通过在自定义单元格内进行修饰来制作基本的动画/翻译
我想将基本动画应用于自定义单元格中的某些元素，例如标签、图像:特别是，我想让这些动画在我触摸单元格内部时也启动。我是初学者，我只学会了使用 animateWithDuration 和 transiti
ios - DateComponentFormatter 翻译
这个问题在这里已经有了答案: NSDateFormatter and current language in iOS11 (5 个回答) 已关闭 3 年前。当使用这样的 DateComponentF
javascript - 在这种情况下如何转换、翻译？
我想在点击 var about 时移动 div.willshow。但我单击那个 btn，只有它获得类 active。然后我再次单击那个 btn 它失去了类。如果我再点击一次，每项任务都无法正常工作。
CSS 翻译 - 意外行为
我想要一个按钮在悬停时向下移动几个像素，但它又回来了。当您还在上面徘徊时，它不应该留在原处吗？ Email Me .btn {background: #2ecc71; padding: .5em 1e
javascript - Angular 翻译
在我的应用程序中，我想添加功能将页面翻译为用户在浏览器中设置的所有语言，如果没有可用的语言，则翻译为默认英语...问题是浏览器与语言支持不一致。我找到了一个解决方法，我对一些返回用户语言的 Web 服
html - 谷歌翻译，翻译 ="no"
我的应用程序有一个 Help.htm 文件，用谷歌翻译翻译得相当好。我想将菜单项标记为“请勿翻译”，但我发现并尝试过的 HTML 标签都不起作用。对于以下内容，我使用了谷歌翻译网站 - 它翻译了我没想
CSS3 翻译() 方法
我有以下代码: span { width:200px; height:100px; background-color:red; border:1px solid black; } span.c2 {

首页

博学

6Ren·AI

商城

deep-learning - 使用 TorchText (PyTorch) 进行语言翻译