gpt4 book ai didi

java - deeplearning4j - 使用 Word2Vec 进行命名实体识别

转载 作者:塔克拉玛干 更新时间:2023-11-02 19:16:30 25 4
gpt4 key购买 nike

我正在尝试复制论文 NLP (almost) from scratch使用 deeplearning4j。我已经完成了以下步骤:

  1. 加载 SENNA 词 vector
  2. 为 CoNLL'03 数据集编写一个迭代器:对于每个单词,我通过连接其相邻单词的单词 vector (窗口大小 = 5)来形成一个单词特征向量
  3. 使用上面的数据集迭代器训练一个简单的回归层,例如:
MultiLayerConfiguration conf = new NeuralNetConfiguration.Builder()
.seed(seed).iterations(iterations)
.learningRate(1e-8f)
.optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
.list(2)
.layer(0, new DenseLayer.Builder()
.nIn(wordVecLayers * windowSize).nOut(hiddenSize)
.activation("relu")
.weightInit(WeightInit.DISTRIBUTION)
.dist(new UniformDistribution(-2.83 / Math.sqrt(hiddenSize), 2.83 / Math.sqrt(hiddenSize)))
.biasInit(0.0f).build())
.layer(1, new OutputLayer.Builder(LossFunction.NEGATIVELOGLIKELIHOOD)
.nIn(hiddenSize).nOut(types.size())
.activation("softmax").weightInit(WeightInit.DISTRIBUTION)
.dist(new UniformDistribution(-2.83 / Math.sqrt(hiddenSize), 2.83 / Math.sqrt(hiddenSize)))
.biasInit(0.0f).build())
.backprop(true).pretrain(false)
.build();

我尝试过许多不同的配置,但没有一个适合我。该模型不断预测所有带有“O”标签的单词。如果您能指出我的方法有什么问题,我将不胜感激?下一步我应该做什么?谢谢!

最佳答案

我们的 word2vec 情感示例是一个很好的起点: https://github.com/deeplearning4j/dl4j-0.4-examples/tree/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/recurrent/word2vecsentiment

这包括对词 vector 进行序列标记(这也是 NER)

关于java - deeplearning4j - 使用 Word2Vec 进行命名实体识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34605430/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com