- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在从事一个大型机器学习/nlp 项目,但我只停留在其中的一小部分。 (PM 我,如果你想知道我到底在做什么。)
我尝试用 Javascript 编写一个程序来学习生成有效的单词,仅通过使用字母表中的所有字母。
我拥有的是一个包含 50 万个不同单词的数据库。这是一个很大的 JS 对象,结构如下(单词是德语):
database = {
"um": {id: 1, word: "um", freq: 10938},
"oder": {id: 2, word: "oder", freq: 10257},
"Er": {id: 3, word: "Er", freq: 9323},
...
}
"freq"
显然是频率的意思。 (也许这个值有时会变得很重要,但我目前不使用它,所以忽略它。)
在第一个之后的迭代中,它不会生成具有随机 字母和随机 字长的单词。它使用基于字母评级和单词长度的概率。
例如,假设它在前 100 次迭代后找到了单词“the”、“so”和“if”。所以字母“t”、“h”、“e”和字母“s”、“o”以及字母“i”、“f”评价不错,2和3的字长也不错评级。因此,在下一次迭代中生成的单词将更有可能包含这些评级好的字母,而不是评级差的字母。
当然,程序还会检查当前生成的单词是否已经生成,如果已经生成,那么这个单词不会被再次评级,而是生成一个新单词。
理论上它应该自己学习最佳字母频率和最佳词长频率,有时只生成有效词。
是的。当然这是行不通的。它在前几次迭代中变得更好,但一旦找到所有 2 个字母的单词,它就会变得更糟。我认为我这样做的整个过程都是错误的。我实际上已经尝试过了,并在 5000 次迭代后为您提供了一个(不太漂亮的)图表:
红线:生成错误词
绿线:生成正确的词
PS:我知道 this , 但它不是在 JS 中,我不理解它,我无法评论它。
最佳答案
另一种方法是使用 Markov Model .
首先计算字典中的字母频率和单词长度频率。然后,创建一个词:
这是一个 0 阶马尔可夫模型。它基于语料库中字母出现的频率。它可能会为您提供与您所拥有的系统类似的结果。
您将从 1 阶马尔可夫模型中获得更好的结果,在该模型中,您计算的不是字母频率,而是双字母组(双字母排列)频率。因此,要选择第一个字母,您只能从用于开始单词的二元组中进行选择。对于后续字母,您可以选择一个跟在先前生成的字母之后的字母。这会给您带来比 0 阶模型更好的结果。
2 阶模型非常有效。请参阅我的博客文章,Shakespeare vs. Markov ,例如。
加权随机数是“随机”选择的数字,但会倾斜以反射(reflect)某种分布。例如,在英语中,字母“e”出现的概率约为 12.7%。 't' 出现的概率为 9.06%,等等。参见 https://en.wikipedia.org/wiki/Letter_frequency .因此,您希望加权随机数生成器的输出近似于该分布。或者,在您的情况下,您希望它近似于语料库中的分布。参见 Weighted random numbers有关如何完成的示例。
关于javascript - 给定字典和字母列表,让程序学习生成有效单词 | Javascript,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43405081/
我有一个 html 格式的表单: 我需要得到 JavaScript在value input 字段执行,但只能通过表单的 submit .原因是页面是一个模板所以我不控制它(不能有
我管理的论坛是托管软件,因此我无法访问源代码,我只能向页面添加 JavaScript 来实现我需要完成的任务。 我正在尝试用超链接替换所有页面上某些文本关键字的第一个实例。我还根据国家/地区代码对这些
我正在使用 JS 打开新页面并将 HTML 代码写入其中,但是当我尝试使用 document.write() 在新页面中编写 JS 时功能不起作用。显然,一旦看到 ,主 JS 就会关闭。用于即将打开的
提问不是为了解决问题,提问是为了更好地理解系统 专家!我知道每当你将 javascript 代码输入 javascript 引擎时,它会立即由 javascript 引擎执行。由于没有看过Engi
我在一个文件夹中有两个 javascript 文件。我想将一个变量的 javascript 文件传递到另一个。我应该使用什么程序? 最佳答案 window.postMessage用于跨文档消息。使
我有一个练习,我需要输入两个输入并检查它们是否都等于一个。 如果是 console.log 正则 console.log false 我试过这样的事情: function isPositive(fir
我正在做一个Web应用程序,计划允许其他网站(客户端)在其页面上嵌入以下javascript: 我的网络应用程序位于 http://example.org 。 我不能假设客户端网站的页面有 JQue
目前我正在使用三个外部 JS 文件。 我喜欢将所有三个 JS 文件合而为一。 尽一切可能。我创建 aio.js 并在 aio.js 中 src="https://code.jquery.com/
我有例如像这样的数组: var myArray = []; var item1 = { start: '08:00', end: '09:30' } var item2 = {
所以我正在制作一个 Chrome 扩展,它使用我制作的一些 TamperMonkey 脚本。我想要一个“主”javascript 文件,您可以在其中包含并执行其他脚本。我很擅长使用以下行将其他 jav
我有 A、B html 和 A、B javascript 文件。 并且,如何将 A JavaScript 中使用的全局变量直接移动到 B JavaScript 中? 示例 JavaScript) va
我需要将以下整个代码放入名为 activate.js 的 JavaScript 中。你能告诉我怎么做吗? var int = new int({ seconds: 30, mark
我已经为我的 .net Web 应用程序创建了母版页 EXAMPLE1.Master。他们的 I 将值存储在 JavaScript 变量中。我想在另一个 JS 文件中检索该变量。 示例1.大师:-
是否有任何库可以用来转换这样的代码: function () { var a = 1; } 像这样的代码: function () { var a = 1; } 在我的浏览器中。因为我在 Gi
我收到语法缺失 ) 错误 $(document).ready(function changeText() { var p = document.getElementById('bidp
我正在制作进度条。它有一个标签。我想调整某个脚本完成的标签。在找到可能的解决方案的一些答案后,我想出了以下脚本。第一个启动并按预期工作。然而,第二个却没有。它出什么问题了?代码如下: HTML:
这里有一个很简单的问题,我简单的头脑无法回答:为什么我在外部库中加载时,下面的匿名和onload函数没有运行?我错过了一些非常非常基本的东西。 Library.js 只有一行:console.log(
我知道 javascript 是一种客户端语言,但如果实际代码中嵌入的 javascript 代码以某种方式与在控制台上运行的代码不同,我会尝试找到答案。让我用一个例子来解释它: 我想创建一个像 Mi
我如何将这个内联 javascript 更改为 Unobtrusive JavaScript? 谢谢! 感谢您的回答,但它不起作用。我的代码是: PHP js文件 document.getElem
我正在寻找将简单的 JavaScript 对象“转储”到动态生成的 JavaScript 源代码中的最优雅的方法。 目的:假设我们有 node.js 服务器生成 HTML。我们在服务器端有一个对象x。
我是一名优秀的程序员,十分优秀!