java - 在 Swift 中使用反向传播的简单神经网络-6ren

java - 在 Swift 中使用反向传播的简单神经网络

转载作者：IT王子更新时间：2023-10-29 05:52:22

我正在尝试使用反向传播实现一个非常简单的神经网络。我尝试使用 AND 逻辑运算符训练网络。但是预测它对我不起作用。 :(

    public class ActivationFunction {

        class func sigmoid(x: Float) -> Float {
            return 1.0 / (1.0 + exp(-x))
        }

        class func dSigmoid(x: Float) -> Float {
            return x * (1 - x)
        }
    }

    public class NeuralNetConstants {

        public static let learningRate: Float = 0.3
        public static let momentum: Float = 0.6
        public static let iterations: Int = 100000

    }

public class Layer {

    private var output: [Float]
    private var input: [Float]
    private var weights: [Float]
    private var dWeights: [Float]

    init(inputSize: Int, outputSize: Int) {
        self.output = [Float](repeating: 0, count: outputSize)
        self.input = [Float](repeating: 0, count: inputSize + 1)
        self.weights = [Float](repeating: (-2.0...2.0).random(), count: (1 + inputSize) * outputSize)
        self.dWeights = [Float](repeating: 0, count: weights.count)
    }

    public func run(inputArray: [Float]) -> [Float] {

        input =  inputArray
        input[input.count-1] = 1
        var offSet = 0

        for i in 0..<output.count {
            for j in 0..<input.count {
                output[i] += weights[offSet+j] * input[j]
            }

            output[i] = ActivationFunction.sigmoid(x: output[i])
            offSet += input.count

        }

        return output
    }

    public func train(error: [Float], learningRate: Float, momentum: Float) -> [Float] {

        var offset = 0
        var nextError = [Float](repeating: 0, count: input.count)

        for i in 0..<output.count {

            let delta = error[i] * ActivationFunction.dSigmoid(x: output[i])

            for j in 0..<input.count {
                let weightIndex = offset + j
                nextError[j] = nextError[j] + weights[weightIndex] * delta
                let dw = input[j] * delta * learningRate
                weights[weightIndex] += dWeights[weightIndex] * momentum + dw
                dWeights[weightIndex] = dw
            }

            offset += input.count
        }

        return nextError
    }

}

public class BackpropNeuralNetwork {

    private var layers: [Layer] = []

    public init(inputSize: Int, hiddenSize: Int, outputSize: Int) {
        self.layers.append(Layer(inputSize: inputSize, outputSize: hiddenSize))
        self.layers.append(Layer(inputSize: hiddenSize, outputSize: outputSize))
    }

    public func getLayer(index: Int) -> Layer {
        return layers[index]
    }

    public func run(input: [Float]) -> [Float] {

        var activations = input

        for i in 0..<layers.count {
            activations = layers[i].run(inputArray: activations)
        }

        return activations
    }

    public func train(input: [Float], targetOutput: [Float], learningRate: Float, momentum: Float) {

        let calculatedOutput = run(input: input)
        var error = [Float](repeating: 0, count: calculatedOutput.count)

        for i in 0..<error.count {
            error[i] = targetOutput[i] - calculatedOutput[i]
        }

        for i in (0...layers.count-1).reversed() {
            error = layers[i].train(error: error, learningRate: learningRate, momentum: momentum)
        }


    }


}

extension ClosedRange where Bound: FloatingPoint {
    public func random() -> Bound {
        let range = self.upperBound - self.lowerBound
        let randomValue = (Bound(arc4random_uniform(UINT32_MAX)) / Bound(UINT32_MAX)) * range + self.lowerBound
        return randomValue
    }
}

这是我的训练数据，我只想让我的网络学习简单的 AND 逻辑运算符。

我的输入数据:

let traningData: [[Float]] = [ [0,0], [0,1], [1,0], [1,1] ]

let traningResults: [[Float]] = [ [0], [0], [0], [1] ]

let backProb = BackpropNeuralNetwork(inputSize: 2, hiddenSize: 3, outputSize: 1)

for iterations in 0..<NeuralNetConstants.iterations {

    for i in 0..<traningResults.count {
        backProb.train(input: traningData[i], targetOutput: traningResults[i], learningRate: NeuralNetConstants.learningRate, momentum: NeuralNetConstants.momentum)
    }

    for i in 0..<traningResults.count {
        var t = traningData[i]
        print("\(t[0]), \(t[1])  -- \(backProb.run(input: t)[0])")
    }

}

这是我的神经网络的全部代码。代码不是很 swift ，但我认为首先更重要的是理解神经网络的理论，然后代码会更 swift 。

问题是我的结果是完全错误的。这是我得到的

0.0, 0.0  -- 0.246135
0.0, 1.0  -- 0.251307
1.0, 0.0  -- 0.24325
1.0, 1.0  -- 0.240923

这就是我想要的

0,0, 0,0 -- 0,000
0,0, 1,0 -- 0,005
1,0, 0,0 -- 0,005
1,0, 1,0 -- 0,992

作为比较，java 实现工作正常..

public class ActivationFunction {

    public static float sigmoid(float x) {
        return (float) (1 / (1 + Math.exp(-x)));
    }

    public static float dSigmoid(float x) {
        return x*(1-x); // because the output is the sigmoid(x) !!! we dont have to apply it twice
    }
}

public class NeuralNetConstants {

    private NeuralNetConstants() {

    }

    public static final float LEARNING_RATE = 0.3f;
    public static final float MOMENTUM = 0.6f;
    public static final int ITERATIONS = 100000;
}

public class Layer {

    private float[] output;
    private float[] input;
    private float[] weights;
    private float[] dWeights;
    private Random random;

    public Layer(int inputSize, int outputSize) {
        output = new float[outputSize];
        input = new float[inputSize + 1];
        weights = new float[(1 + inputSize) * outputSize];
        dWeights = new float[weights.length];
        this.random = new Random();
        initWeights();
    }

    public void initWeights() {
        for (int i = 0; i < weights.length; i++) {
            weights[i] = (random.nextFloat() - 0.5f) * 4f;
        }
    }

    public float[] run(float[] inputArray) {

        System.arraycopy(inputArray, 0, input, 0, inputArray.length);
        input[input.length - 1] = 1; // bias
        int offset = 0;

        for (int i = 0; i < output.length; i++) {
            for (int j = 0; j < input.length; j++) {
                output[i] += weights[offset + j] * input[j];
            }
            output[i] = ActivationFunction.sigmoid(output[i]);
            offset += input.length;
        }

        return Arrays.copyOf(output, output.length);
    }

    public float[] train(float[] error, float learningRate, float momentum) {

        int offset = 0;
        float[] nextError = new float[input.length];

        for (int i = 0; i < output.length; i++) {

            float delta = error[i] * ActivationFunction.dSigmoid(output[i]); 
            for (int j = 0; j < input.length; j++) {
                int previousWeightIndex = offset + j;
                nextError[j] = nextError[j] + weights[previousWeightIndex] * delta;
                float dw = input[j] * delta * learningRate;
                weights[previousWeightIndex] += dWeights[previousWeightIndex] * momentum + dw;
                dWeights[previousWeightIndex] = dw;
            }

            offset += input.length;
        }

        return nextError;
    }
}

public class BackpropNeuralNetwork {

    private Layer[] layers;

    public BackpropNeuralNetwork(int inputSize, int hiddenSize, int outputSize) {
        layers = new Layer[2];
        layers[0] = new Layer(inputSize, hiddenSize);
        layers[1] = new Layer(hiddenSize, outputSize);
    }

    public Layer getLayer(int index) {
        return layers[index];
    }

    public float[] run(float[] input) {
        float[] inputActivation = input;
        for (int i = 0; i < layers.length; i++) {
            inputActivation = layers[i].run(inputActivation);
        }
        return inputActivation;
    }

    public void train(float[] input, float[] targetOutput, float learningRate, float momentum) {

        float[] calculatedOutput = run(input);
        float[] error = new float[calculatedOutput.length];

        for (int i = 0; i < error.length; i++) {
            error[i] = targetOutput[i] - calculatedOutput[i]; 
        }

        for (int i = layers.length - 1; i >= 0; i--) {
            error = layers[i].train(error, learningRate, momentum);
        }
    }
}

public class NeuralNetwork {

    /**
     * @param args the command line arguments
     */
    public static void main(String[] args) {
                float[][] trainingData = new float[][] { 
                new float[] { 0, 0 }, 
                new float[] { 0, 1 }, 
                new float[] { 1, 0 },
                new float[] { 1, 1 } 
        };

        float[][] trainingResults = new float[][] {
                new float[] { 0 }, 
                new float[] { 0 }, 
                new float[] { 0 },
                new float[] { 1 } 
        };

        BackpropNeuralNetwork backpropagationNeuralNetworks = new BackpropNeuralNetwork(2, 3,1);

        for (int iterations = 0; iterations < NeuralNetConstants.ITERATIONS; iterations++) {

            for (int i = 0; i < trainingResults.length; i++) {
                backpropagationNeuralNetworks.train(trainingData[i], trainingResults[i],
                        NeuralNetConstants.LEARNING_RATE, NeuralNetConstants.MOMENTUM);
            }

            System.out.println();
            for (int i = 0; i < trainingResults.length; i++) {
                float[] t = trainingData[i];
                System.out.printf("%d epoch\n", iterations + 1);
                System.out.printf("%.1f, %.1f --> %.3f\n", t[0], t[1], backpropagationNeuralNetworks.run(t)[0]);
            }
        }
    }

}

最佳答案

您正在以不同方式初始化您的权重。您正在创建一个随机值并经常使用它。您要做的是为数组中的每个权重创建一个随机值:替换

self.weights = [Float](repeating: (-2.0...2.0).random(), count: (1 + inputSize) * outputSize)

与

self.weights = (0..<(1 + inputSize) * outputSize).map { _ in
  return (-2.0...2.0).random()
}

除此之外:请考虑仅覆盖 Layer.run 方法中输入的第一个元素。所以不是

input =  inputArray

你应该这样做:

for (i, e) in inputArray {
  self.input[i] = e
}

关于java - 在 Swift 中使用反向传播的简单神经网络，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42940335/

文章推荐： javascript - 我的 javascript 代码有什么错误？

文章推荐： Swift 泛型 : "Cannot specialize non-generic type"

文章推荐： javascript - 对所有事件使用 jQuery .on()

java - @Transactional(传播=传播。需要)
如果有人能解释这个注释的作用以及我们何时使用它: @Transactional(propagation=Propagation.REQUIRED) 谢谢最佳答案如果您需要在 Spring Docs
Javascript - 阻止模态键盘事件冒泡/传播
我有一个页面，它有一个 keydown 事件监听器，用于监听 Escape 键，以便返回。我还有一个简单的模态类，它也监听 Escape 键以关闭它。主页监听器检查模式是否打开，如果打开，则不执行任何
Modelica 传播/默认变量名
我想在模型中设置默认变量名称 T (=xx) - 将该模型拖到新模型中并在其中定义变量 xx。我收到错误消息:使用未声明的变量 xx。这是子模型 model test parameter Rea
jqueryMobile 水龙头和冒泡/传播
在 android 2.x 浏览器中查看此示例..它是在我的应用程序中复制场景的示例.. http://johnchacko.net/samples/tap.html 它是关于监听“tap”并从监听器
C# 捕获特定异常类型的重新抛出/传播
如您所见，我正在尝试将 GatewayConnectionFailedException 传播到我的 UI。我希望此代码捕获除异常之外的所有内容，我希望表示层捕获该异常以通知用户数据库是问题所在，以便
CMake 静态库依赖项不随 ExternalProject_Add 传播
我目前正在尝试让可执行文件与它需要的所有依赖项正确链接。这是依赖项的示例结构: exe -> libA -> libB exe和 libA有自己的存储库。 exe拉入libA像这样的东西: add_
scala - Scala中的“传播”参数？
有什么方法可以调用带有单个参数的 Scala 函数，给定一个数组 (类似于 JavaScript Spreads在 ECMAScript 6) 中？ ys = [10.0, 2.72, -3.14]
Cmake:包含目录的 target_link_libraries 传播
我有一个小型静态库，它需要 boost 头文件，并且需要包含目录中的“include”目录。 ... add_library(alib STATIC ...) target_include_direc
javascript - 传播 Promise 并在新对象中扩展
我有一些 promise 可以返回对象。现在我想将它们合并/扩展为一个新对象，因此我使用 Lodash's extend . var whenEverythingIsDone = Promise.a
scala - 传播 Scala 类型参数
这是我认为人们通常希望在 Scala 中做的事情，但如果我能在任何地方找到一个例子，我就该死了。这段代码由于类型删除而无法编译，但它演示了我正在努力完成的事情: def parse[T](json:
scala - 传播 Scala 类型参数
这是我认为人们通常希望在 Scala 中做的事情，但如果我能在任何地方找到一个例子，我就该死了。这段代码由于类型删除而无法编译，但它演示了我正在努力完成的事情: def parse[T](json:
Sharepoint default.master 传播？
我们有大量 MOSS 2007 站点需要添加大量的 javascript。我编辑、 checkin 、发布并批准了对 default.master 的更改，更改反射(reflect)在根网站上，但没有
jQuery:函数被调用两次。传播？为什么会出现这种情况？
请看一下下面的 fiddle :http://jsfiddle.net/K9NjY/ 我在这段代码上花了 3-4 个小时，并将其缩小到最短的版本，但现在我陷入了困境。问题:1. 点击“divOne”
java - Spring 集成中的错误处理/传播
我读到如果在流程中抛出异常，框架要做的第一件事就是检查消息头中的错误 channel 属性。总是这样吗？在我的特殊情况下，我将自定义错误 channel 分配给消息 header ，但该消息似乎已向
c++ - 不能通过carry让值(value)传播
创建一个小的 C++ 大型精度类，一切似乎都运行良好，但是添加，如果我将 0xffffffff 和 0x04 加在一起，我会得到 0xffff0003，而我应该得到 0x0100000003。这是有问
javascript - react : problems with . ..传播
我正在尝试重新创建 Dan Abramov 类(class)中的 Redux 示例。传播{...store.getState()}在应用程序级别不起作用，Redux 正在更改状态并且 React 不会
mysql - 传播.REQUIRES_NEW 锁定
考虑一个需要很长时间的事务。在此期间，我想对 TableSmall 执行一些小更新。，它应该立即执行，并且主事务的回滚不应该回滚那些小的更新。我当前的问题是这些小更新将锁定 TableSmall\
c - 如何处理子函数中的 const 传播
我需要对现有函数进行修改，具有一些 const 输入参数: int f(const owntype *r1, const owntype *r2) 为了做到这一点，我想调用一个使用相同类型但没有 co
c# - 传播 DependencyProperty 默认值
我有一个带有 ViewModel 的 WPF UserControl: 这个 UserControl 有一个 De
android - 停止 SMS 传播
我试图在收到这样的短信时不传播 public class SMSReceiver extends BroadcastReceiver { @Override public void onRec

IT王子

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 在 Swift 中使用反向传播的简单神经网络