- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在尝试使用 tensorflow.js 构建和训练 lstm 网络,我的数据集就像
输入:“我不喜欢这双鞋,它们对我来说太黄了。所以返回。”预期输出原因:“颜色”
我可以使用预训练的 word2vec 模型将文本呈现为向量。尝试阅读文档 tensorflow.js但我无法从中得到太多意义,即使从其他来源也找不到关于如何在 tensorflow.js 中实现和训练网络的好例子。
谁能提供一个使用 LSTM 层创建模型并使用 node.js 和 tensorflow.js 对其进行训练的直接示例?
最佳答案
这是一个带有多层 LSTM 的 RNN 示例,它实现了 Word2Vec。我认为您不需要对其进行太多调整来匹配您的用例——可能只需要数据源和超参数。当然,您也需要编写自己的测试函数。既然您说您可以提供自己的预训练 Word2Vec 向量,那么您也可以根据需要删除大部分代码。
我应该注意 - 我写了这个例子,我的偏好是使用一个名为 Numjs 的库创建向量(它是与 Numpy 类似的库),然后将它们转换为 Tensorflow.js 使用的张量。这并不是 Tensorflow.js 设计使用的方式,但我发现他们创建张量的方法过于繁琐且不直观。
无论如何,这是我的示例(使用 node.js)。我希望你觉得它有用。
require('@tensorflow/tfjs-node')
const tf = require('@tensorflow/tfjs');
const fs = require('fs');
var nj = require('numjs');
const maxlen = 30;
const step = 3;
fs.readFile(<file>, 'utf8', function (error, data) {
if (error) throw error;
var text = data.toString();
create_model(text)
});
function onlyUnique(value, index, self) {
return self.indexOf(value) === index;
}
function indexOfMax(arr) {
if (arr.length === 0) {
return -1;
}
var max = arr[0];
var maxIndex = 0;
for (var i = 1; i < arr.length; i++) {
if (arr[i] > max) {
maxIndex = i;
max = arr[i];
}
}
return maxIndex;
}
function sample(preds, temperature) {
preds = nj.array(preds, 'float64');
preds = nj.log(preds).divide(temperature)
exp_preds = nj.exp(preds)
preds = exp_preds.divide(nj.sum(exp_preds))
arr = preds.tolist()
return indexOfMax(arr)
}
async function create_model(text) {
/* data prep */
text = text.toLowerCase()
console.log('corpus length:', text.length)
var words = text.replace(/(\r\n\t|\n|\r\t)/gm," ").split(" ")
words = words.filter(onlyUnique)
words = words.sort()
words = words.filter(String)
console.log("total number of unique words" + words.length)
var word_indices = {}
var indices_word = {}
for (let e0 of words.entries()) {
var idx = e0[0]
var word = e0[1]
word_indices[word] = idx
indices_word[idx] = word
}
console.log("maxlen: " + maxlen, " step: " + step)
var sentences = []
var sentences1 = []
var next_words = []
list_words = text.toLowerCase().replace(/(\r\n\t|\n|\r\t)/gm," ").split(" ").filter(String)
console.log('list_words ' + list_words.length)
for (var i = 0; i < (list_words.length - maxlen); i += step) {
var sentences2 = list_words.slice(i, i + maxlen).join(" ")
sentences.push(sentences2)
next_words.push(list_words[i + maxlen])
}
console.log('nb sequences(length of sentences):', sentences.length)
console.log("length of next_word", next_words.length)
console.log('Vectorization...')
var X = nj.zeros([sentences.length, maxlen, words.length])
console.log('X shape' + X.shape)
var y = nj.zeros([sentences.length, words.length])
console.log('y shape' + y.shape)
for (let e of sentences.entries()) {
var i = e[0]
var sentence = e[1]
for (let e2 of sentence.split(" ").entries()) {
var t = e2[0]
var word = e2[1]
X.set(i, t, word_indices[word], 1)
}
y.set(i, word_indices[next_words[i]], 1)
}
console.log('Creating model... Please wait.');
console.log("MAXLEN " + maxlen + ", words.length " + words.length)
var model = tf.sequential();
model.add(tf.layers.lstm({
units: 128,
returnSequences: true,
inputShape: [maxlen, words.length]
}));
model.add(tf.layers.dropout(0.2))
model.add(tf.layers.lstm({
units: 128,
returnSequences: false
}));
model.add(tf.layers.dropout(0.2))
model.add(tf.layers.dense({units: words.length, activation: 'softmax'}));
model.compile({loss: 'categoricalCrossentropy', optimizer: tf.train.rmsprop(0.002)});
x_tensor = tf.tensor3d(X.tolist(), null, 'bool')
//x_tensor.print(true)
y_tensor = tf.tensor2d(y.tolist(), null, 'bool')
//y_tensor.print(true)
/* training */
await model.fit(x_tensor, y_tensor, {
epochs: 100,
batchSize: 32,
callbacks: {
onEpochEnd: async (epoch, logs) => {
console.log(logs.loss + ",")
}
}
})
关于node.js - 如何在 tensorflow.js 中构建和训练 lstm 网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52546444/
我正在学习构建单页应用程序 (SPA) 所需的所有技术。总而言之,我想将我的应用程序实现为单独的层,其中前端仅使用 API Web 服务(json 通过 socket.io)与后端通信。前端基本上是
当我看到存储在我的数据库中的日期时。 这是 正常 。日期和时间就是这样。 但是当我运行 get 请求来获取数据时。 此格式与存储在数据库 中的格式不同。为什么会发生这种情况? 最佳答案 我认为您可以将
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在尝试使用backbone.js 实现一些代码 和 hogan.js (http://twitter.github.com/hogan.js/) Hogan.js was developed ag
我正在使用 Backbone.js、Node.js 和 Express.js 制作一个 Web 应用程序,并且想要添加用户功能(登录、注销、配置文件、显示内容与该用户相关)。我打算使用 Passpor
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
我尝试在 NodeJS 中加载数据,然后将其传递给 ExpressJS 以在浏览器中呈现 d3 图表。 我知道我可以通过这种方式加载数据 - https://github.com/mbostock/q
在 node.js 中,我似乎遇到了相同的 3 个文件名来描述应用程序的主要入口点: 使用 express-generator 包时,会创建一个 app.js 文件作为生成应用的主要入口点。 通过 n
最近,我有机会观看了 john papa 关于构建单页应用程序的精彩类(class)。我会喜欢的。它涉及服务器端和客户端应用程序的方方面面。 我更喜欢客户端。在他的实现过程中,papa先生在客户端有类
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我是一个图形新手,需要帮助了解各种 javascript 2D 库的功能。 . . 我从 Pixi.js 中得到了什么,而我没有从 Konva 等基于 Canvas 的库中得到什么? 我从 Konva
我正在尝试将一些 LESS 代码(通过 ember-cli-less)构建到 CSS 文件中。 1) https://almsaeedstudio.com/ AdminLTE LESS 文件2) Bo
尝试查看 Express Passport 中所有登录用户的所有 session ,并希望能够查看当前登录的用户。最好和最快的方法是什么? 我在想也许我可以在登录时执行此操作并将用户模型数据库“在线”
我有一个 React 应用程序,但我需要在组件加载完成后运行一些客户端 js。一旦渲染函数完成并加载,运行与 DOM 交互的 js 的最佳方式是什么,例如 $('div').mixItUp() 。对
请告诉我如何使用bodyparser.raw()将文件上传到express.js服务器 客户端 // ... onFilePicked(file) { const url = 'upload/a
我正在尝试从 Grunt 迁移到 Gulp。这个项目在 Grunt 下运行得很好,所以我一定是在 Gulp 中做错了什么。 除脚本外,所有其他任务均有效。我现在厌倦了添加和注释部分。 我不断收到与意外
我正在尝试更改我的网站名称。找不到可以设置标题或应用程序名称的位置。 最佳答案 您可以在 config/ 目录中创建任何文件,例如 config/app.js 包含如下内容: module.expor
经过多年的服务器端 PHP/MySQL 开发,我正在尝试探索用于构建现代 Web 应用程序的新技术。 我正在尝试对所有 JavaScript 内容进行排序,如果我理解得很好,一个有效的解决方案可以是服
我是 Nodejs 的新手。我在 route 目录中有一个 app.js 和一个 index.js。我有一个 app.use(multer....)。我还定义了 app.post('filter-re
我正在使用 angular-seed用于构建我的应用程序的模板。最初,我将所有 JavaScript 代码放入一个文件 main.js。该文件包含我的模块声明、 Controller 、指令、过滤器和
我是一名优秀的程序员,十分优秀!