algorithm - 谷歌键盘使用哪种算法进行自动建议(包括个人词汇)？-6ren

algorithm - 谷歌键盘使用哪种算法进行自动建议(包括个人词汇)？

转载作者：行者123 更新时间：2023-11-30 09:03:17

24

4

我很困惑，因为谷歌无法用每个人的个人词汇来训练他们的文本生成模型。

我试图开发类似的东西，但当神经网络训练期间类的数量变得动态时，我陷入了困境。

如果我不知道类的数量，1 如何给出层的大小和输入的维度。

假设谷歌知道英语词汇中的单词，并且我将俚语中的一些单词添加到我的个人词典中，它将来能够向我建议这些单词。

假设 google 词汇由 10 个单词组成，我在一个序列中给它 5 个单词，它会将它们编码为大小为 (5x10) 的 1 和 0 向量。

然后我添加了 4 个新单词。现在总词汇量 = 14

但 RNN(如果使用)是使用仅 10 个单词的词汇量进行训练的。它无法对这些新单词进行编码，因为这些新单词在训练时不属于词汇。

它是否使用 (5x14) 大小的向量重新训练其文本生成模型？

最佳答案

根据 Google AI article ，他们结合使用了两种方法:

神经空间模型:解决字符级别的认知和运动错误(表现为拼写错误、字符插入、删除或交换等)。他们使用受语音处理启发的 CTC 损失函数训练字符级 LSTM 模型。
有限状态转换器:提供语言词汇约束(语言中出现哪些单词)和语法约束(哪些单词可能跟在其他单词后面)。后者是使用概率 n-gram 模型来表示键盘的语言模型来完成的。

对于您的情况，我建议如下:

您的 RNN 需要在字符级而不是单词级进行训练才能追踪拼写错误。
使用 n-gram 模型来跟踪哪些单词通常伴随哪些单词。这需要根据您喜欢的词汇进行训练。
最后，这并不容易，但却是可行的!

关于algorithm - 谷歌键盘使用哪种算法进行自动建议(包括个人词汇)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59299832/

24

4

0

文章推荐： machine-learning - 如何将 Kfold 与 TfidfVectorizer 一起应用？

文章推荐： javascript - jquery 在 IE6 中不工作

文章推荐： java - 如何将jpeg图片转为jpeg2000无损压缩图片？

文章推荐： javascript - 正则表达式 + jquery - 修改文本

dede会员列表调用适用于企业、个人
CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章dede会员列表调用适用于企业、个人由作者收集整理，如果你对这篇文章有兴
mysql - 个人/群组消息传递架构
如何在 MySQL 中创建个人组消息传递的消息对话架构。是否有可能创建以下场景。已读/未读如果用户删除对话不影响其他对话。(例如用户 A 和 B 有消息对话 A 清除消息，则 B 消息不应影响)
个人 github 页面上的数据库
是否可以将一些数据存储在您的个人 github 页面的某个位置？例如触发计数器的按钮。当您单击该按钮时，计数器会加 1。当其他用户访问该页面并单击该按钮时，计数器会再次加 1。因此它将是页面上显示
azure - 个人 Microsoft 帐户的守护程序应用程序权限
我正在编写一个守护程序应用程序来使用 Outlook Mail REST API ( https://learn.microsoft.com/en-us/previous-versions/offic
audio - 个人 DirecShow 在音频渲染上的优点
我的电脑有两个外置声卡和一个在带有 windows vista 的主板上。在 Vista 中，它看到同一个声卡的两个实体，一个数字输出和一个模拟输出。当我尝试播放带有数字音频的视频文件时，比如 dv
ios - 个人 Apple 开发者计划中的多个开发者
我有一个个人 Apple 开发者计划，我希望我的 friend 帮助我开发我的应用程序。我的 friend ，他自己有一个个人 Apple 开发者计划，所以他创建了一个新的 Apple ID，我将他的
个人 Tumblr 帖子上的 Javascript
我知道您可以编辑在 tumblr 博客上呈现所有帖子博客主页的 html/AngularJS。但是，有没有办法添加自定义 ...到个别职位？我想在逐个帖子的基础上做一些 javascript 的事情，
c - 个人 Valgrind 异常
首先，我想提前感谢您在此问题上提供的任何帮助。 Valgrind下面粘贴的输出源自以下单行 C 代码。 for( j=i;jsize-1;j++ ) s3->delete_tail( s3 ); 但是
ssl - 个人 SSL 证书
我有几个服务器在测试环境中运行我有一个 CA 并且可以认证一个页面。是否可以为从我收到的 CA 派生的测试环境创建我自己的 CA？最佳答案您可以使用 java 开发工具 keytool 在将要运
ios - 个人 UITabBaritem 色调颜色
我正在尝试实现 custom UITabbar . 我发现的任何东西都涉及在 tabbarItem 上覆盖一个矩形。那么有什么直接的方法可以做到这一点吗？最佳答案要更改单个 tabBar 项目的色
Git 如何重新设置我已经推送的(个人)分支？
我读了git book但不知何故忘记了rule上面写着: Do not rebase commits that you have pushed to a public repository. If y
git - 个人 GIT 仓库
我在工作中使用 BitKeeper，我想在家里为自己做一个基本的代码备份(考虑到我很少备份) //我以前从未使用过 git，所以我需要很多帮助我认为在我的家庭服务器上有一个 git 存储库可能是个好
c++ - 提取扫描文档的一部分(个人 ID)——选择哪个库和方法？
我必须处理大量扫描的 ID，我需要从中提取照片以进行进一步处理。这是一个虚构的例子: 问题是扫描没有完全对齐(最多旋转 10 度)。所以我需要找到它们的位置，旋转它们并剪出照片。事实证明，这比我原先想
java - 在给定的代码块中查找错误(类的扩展，个人/学生)
在下面的代码块中，有几个(故意的)错误，我的任务是找到它们并解释这些错误是否会导致编译代码时出现问题，或者至少会导致一些逻辑问题。 public class Person { private St
algorithm - 给定 N 个人，其中一些是敌人，找出没有敌人的区间数
一个 friend 给了我这个问题作为挑战，我试图在 LeetCode 上找到这样的问题，但很遗憾没有找到。问题 Given a line of people numbered from 1 to
azure - 如何使用Azure(个人)帐户设置VSTS(企业)帐户以进行持续部署
我有一个绑定(bind)到 VSTS 的公司帐户，以及一个绑定(bind)到同一电子邮件地址但作为个人帐户的 Azure 帐户。 VSTS 帐户:[email protected] (公司账户) Az
asp.net-mvc - “个人”是一种类型，在给定上下文中无效
我刚刚创建了一个新的 MVC 项目并创建了一个空 View 。我在尝试声明 View 的模型时编写了第一行代码，如下所示: @model Personal; 其中，personal 是实际存在的模型
kotlin - 个人 Kotlin 之谜:为什么它和b具有不同的值(value)？
我是Kotlin的新手，我尝试理解所示的交换两个变量值的简短代码。我不明白为什么它和b在Also函数中具有不同的值。他们不使用十进制值2引用相同的内存地址吗？谢谢。 var a = 1 var b
java - 查询所有 "AnnotationAssertions"的类(class)/个人
我正在尝试查询与类/个人相关的所有 AnnotationAssertion。下面是我的来源片段: #Car
windows-vista - 设置(个人)可执行文件/代码时间戳服务需要什么？
我们目前正在使用威瑞信的时间戳服务，但时间戳服务器时常变得不可用 - 主要是由于我们的 ISP 故障。我们现在为我们构建的所有内容添加时间戳，甚至是简单的开发构建，因为我们在 Vista 中遇到了很

首页

博学

6Ren·AI

商城

algorithm - 谷歌键盘使用哪种算法进行自动建议(包括个人词汇)？