c++ - 间歇性 "Aborted Core Dumped"。也许是 static

c++ - 间歇性 "Aborted Core Dumped"。也许是 static_cast 的错？

转载作者：行者123 更新时间：2023-11-28 05:25:29

我正在编写一个基于图形的反向传播神经网络，作为个人项目。仍在前进的支柱步骤。它编译。一半时间成功运行，一半时间在最后一步崩溃。它似乎在某些垃圾收集步骤中快要死了。我是虚函数和 static_cast 的新手，所以我想知道是否应该归咎于这些部分。 GDB 说“程序收到信号 SIGABRT，已中止。__gnu_cxx::new_allocator::deallocate(double*, unsigned long) () 中的 0x00000000100404740”

构成代码前半部分的函数可能不是罪魁祸首，因为它们在我的神经网络(没有图表)的一个更简单的旧版本中工作。我敢打赌它在某处的结构中。

更新:如果我使用 123 而不是基于时间的随机种子生成随机数，它每次都会运行。 seed=124 每次都失败。去除随机性以支持恒定权重也允许它每次都运行。我很困惑!

#include <bits/stdc++.h>
using namespace std;

#define p(x) cout << #x << " = "<< x<< endl
#define min(a,b) a<b ? a : b
typedef vector<double> d1;
typedef vector<d1> d2;
typedef vector<d2> d3;
typedef vector<int> i1;

int argmax(d1 x){
  p(x.size());
  int maxIndex=0;
  double maxValue=x[0];
  for (int i=1; i<x.size(); i++){
    if (x[i] > maxValue){
      maxValue = x[i];
      maxIndex = i;
    }
  }
  return maxIndex;
}

d1 zeros(int n){
  return d1(n);
}

d2 zeros(int rows, int cols){
  return d2(rows, d1(cols, 0));
}

d3 zeros(int x, int rows, int cols){
  return d3(x, d2(rows, d1(cols, 0)));
}

void print(d1 x){
  for (double d: x)
  cout << d << endl;
  cout << endl;
}

void print(d2 x){
  for (auto row: x){
    for (double d: row){
      cout << d << " ";
    }
    cout << endl;
  }
  cout << endl;
}

void print(d3 x){
  for (d2 X: x)
  print(X);
}



void toRank2(d1&x, int rows, d2& y){
  for (int i=0; i<x.size()/rows; i++){
    y.emplace_back();
    for (int row=0; row<rows; row++){
      y[i].push_back(x[i*rows+row]);
    }
  }
}

void toRank3(d1& x, int rows, int cols, d3& y){
  for (int i=0; i<x.size()/rows/cols; i++){
    y.emplace_back();
    for (int row=0; row<rows; row++){
      y[i].emplace_back();
      for (int col=0; col<cols; col++){
        y[i][row].push_back(x[i*rows*cols+row*cols+col]);
      }
    }
  }
}

d1 getRandomDoubles(int size, double mean=0, double standard_deviation=1){
  static normal_distribution<double> distribution(mean, standard_deviation);
  int seed=time(NULL);
  static default_random_engine generator(seed);
  d1 data(size);
  generate(data.begin(), data.end(), []() { return distribution(generator); });
  return data;
}

d2 getRandomDoubles(int rows, int cols, double mean=0, double standard_deviation=1){
  d1 d = getRandomDoubles(rows*cols, mean, standard_deviation);
  d2 e;
  toRank2(d, cols, e);
  return e;
}

d3 getRandomDoubles(int depth, int rows, int cols, double mean=0, double standard_deviation=1){
  d1 d = getRandomDoubles(depth*rows*cols, mean, standard_deviation);;
  d3 e;
  toRank3(d, rows, cols, e);
  return e;
}

struct Node{
  vector<Node*> parents, children;
  bool ready=false;
  //
  // bool check_ready(){
  //   for (Node* n: parents)
  //   if (!n->check_ready())
  //   return false;
  //   return true;
  // }
  //
  void add_child(Node& n){
    children.push_back(&n);
    n.parents.push_back(this);
  }

  void forward_propagate(){
    cout << "starting r2 forward" <<endl;
  //  if (parents.size()==0 || updated_parents == parents.size()-1)
    for (Node* n: children){
      cout << "loop" << endl;
      n->update_state();
      //  cout << "root child forward" << endl;
    }
    cout << "exiting r2 forward" << endl;
    //updated_parents++;
  }

  virtual void update_state(){
    //if (parents.size()==0 || updated_parents == parents.size() - 1)
    forward_propagate();
  }
};

struct r1:Node{
  vector<double> state;
  int r;

  r1(){}

  r1(int R){
    r=R;
    state = vector<double>(r);
  }
};

struct r2:Node{
  vector<vector<double>> state;
  int r,c;

  r2(){}
  r2(int R, int C){
    r=R;
    c=C;
    state = zeros(r, c);
  }
};

struct r3:Node{
  d3 state;
  int r, c, d;
  r3(){}
  r3(int R, int C, int D){
    r=R;
    c=C;
    d=D;
    state = zeros(R,C,D);
  }
};

struct MatrixProduct1_1: r1{
  MatrixProduct1_1(int n):r1(n){}

  void update_state() override{
    cout << "mat11" << endl;
    d2& W = static_cast<r2*>(parents[0])->state;
    d1& x = static_cast<r1*>(parents[1])->state;
    state = zeros(r);
    for (int i=0; i<W.size(); i++)
    for (int j=0; j<W[0].size(); j++)
    state[i] += W[i][j]*x[j];
    forward_propagate();
  }
};

struct MatrixProduct2_1: r1{
  MatrixProduct2_1(int n):r1(n){}

  void update_state() override{
    cout << "matt21" << endl;
    d3& W = static_cast<r3*>(parents[0])->state;
    d2& x = static_cast<r2*>(parents[1])->state;
    state = zeros(r);
    for (int i=0; i<W.size(); i++)
    for (int j=0; j<W[0].size(); j++)
    for (int k=0; k<W[0][0].size(); k++)
    state[k] += W[i][j][k]*x[i][j];
    forward_propagate();
  }
};

struct Convolution: r2{
  Convolution(int r, int c): r2(r, c){}
  void update_state() override{
    cout << "convolving" << endl;
    state = zeros(r, c);
    d2& W = static_cast<r2*>(parents[0])->state;
    d2& x = static_cast<r2*>(parents[1])->state;

    int wCenterX = W[0].size() / 2;
    int wCenterY = W.size() / 2;
    int rows = x.size(), cols = x[0].size();
    int wRows = W.size(), wCols = W[0].size();

    //#pragma omp parallel for
    for(int i=0; i < rows; i++)
    for(int j=0; j < cols; j++)
    for(int m=0; m < W.size(); m++){
      int mm = W.size() - 1 - m;
      for(int n=0; n < wCols; n++){
        int nn = wCols - 1 - n;
        int ii = i + (m - wCenterY);
        int jj = j + (n - wCenterX);
        if (ii >= 0 && ii < rows && jj >= 0 && jj < cols)
        state[i][j] += x[ii][jj] * W[mm][nn];
      }
    }
    forward_propagate();
  }
};


struct RELU: r2{
  RELU(int r, int c):r2(r, c){}
  void update_state() override{
    cout << "relu2" << endl;
    state = zeros(r,c);
    d2& x = static_cast<r2*>(parents[0])->state;
    for (int i=0; i<state.size(); i++)
    for (int j=0; j<state[0].size(); j++)
    if (x[i][j] > 0)
    state[i][j] = x[i][j];
    forward_propagate();
  }
};

struct Softmax: r1{
  Softmax(int r):r1(r){}
  void update_state() override{
    cout << "softmax" << endl;
    state = zeros(r);
    p(parents.size());
    d1& x = static_cast<r1*>(parents[0])->state;
    cout << "got state" << endl;
    //p(x.size());
    //print(x);

    p(x.size());
    cout << "argmax " << argmax(x) << endl;
    double largest = x[argmax(x)];
    double lndenom = largest;
    double expsum = 0;
    cout << "starting expsum" << endl;
    for (int i=0; i<x.size(); i++)
    //expsum += exp(x[i]-largest);
    expsum += x[i] - largest;
    cout << "next loop " << endl;
    for (int i=0; i<x.size(); i++)
  //  state[i] = exp(x[i]-largest) / expsum;
    state[i] = x[i]-largest;
    cout << "forward proping" << endl;
    cout << "weird" << endl;
  //  forward_propagate();
    cout << "done with softmax" <<endl;
  }
};

struct Add1: r1{
  Add1(int r):r1(r){}
  void update_state() override{
    cout << "add1ing" << endl;
    d1& x = static_cast<r1*>(parents[0])->state;
    d1& y = static_cast<r1*>(parents[1])->state;
    for (int i=0; i<r; i++)
    state[i] = x[i]+y[i];
    forward_propagate();
  }
};

struct Add2: r2{
  Add2(int r, int c): r2(r, c){}
  void update_state() override{
    d2& x = static_cast<r2*>(parents[0])->state;
    d2& y = static_cast<r2*>(parents[1])->state;
    for (int i=0; i<x.size(); i++)
    for (int j=0; j<x[0].size(); j++)
    state[i][j] = x[i][j] + y[i][j];
    forward_propagate();
  }
};

struct MaxPool: r2{
  MaxPool(int r, int c): r2(r, c){}
  void update_state() override{
    d2& x = static_cast<r2*>(parents[0])->state;
    for (int i=0; i<x.size(); i+=2)
    for (int j=0; j<x[0].size(); j+=2)
    state[i/2][j/2] = max(max(x[i][j], x[i+1][j]), max(x[i+1][j], x[i+1][j+1]));
    forward_propagate();
  }
};

int main(){
  Node root;
  r2 x;
  x.state = getRandomDoubles(28,28);
  r2 wConv;
  wConv.state = getRandomDoubles(10, 10);
  root.add_child(x);
  root.add_child(wConv);
  Convolution c(28,28);
  wConv.add_child(c);
  x.add_child(c);
  Add2 a(28,28);
  r2 bConv(28,28);
  bConv.state = getRandomDoubles(28,28);
  c.add_child(a);
  bConv.add_child(a);
  RELU r(28,28);
  a.add_child(r);
  MaxPool max(14, 14);
  r.add_child(max);
  r3 wFull(10,28,28);
  wFull.state = getRandomDoubles(10,28,28);
  // print(wFull.state);
  // return 0;
  MatrixProduct2_1 full(10);
  wFull.add_child(full);
  max.add_child(full);
  r1 bFull(10);
  bFull.state = getRandomDoubles(10);
  Add1 aFull(10);
  aFull.state[0] = 123;
  full.add_child(aFull);
  bFull.add_child(aFull);
  Softmax s(10);
  aFull.add_child(s);
  // d1& x =         static_cast<r1*>(parents[0])->state;
  // d1& asdf = static_cast<r1*>(s.parents[0])->state;
  // print(asdf);
  //root.forward_propagate();
  x.forward_propagate();
  //print(s.state);
  cout << "returning main";
}

最佳答案

static_cast 应该很少需要。这也不异常(exception)。你的节点真的应该知道他们的邻居有什么类型。

我无法立即发现具体问题，但我熟悉神经网络。像 struct MatrixProduct1_1: r1 这样的代码几乎是一个红色警报。为什么它是一个结构体，为什么它继承自 r1 ？在神经网络理论中，矩阵乘积是表达两层节点之间完整连接的方式。话又说回来，节点通常具有标量激活。

可以使用继承来实现激活函数，但您需要从 Node 继承它。这意味着你不能同时拥有那些 r1..r3 类型，但我还是不明白这些。

TLDR:类型被搞乱了，你用 static_cast 隐藏了它，但这只会让它编译，并不能让它正确。

关于c++ - 间歇性 "Aborted Core Dumped"。也许是 static_cast 的错？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40624341/

文章推荐： html - 如何根据屏幕尺寸对齐图片和文字？

文章推荐： css - 绝对定位的 child 与边界

文章推荐： c++ - 如何使用用户定义的函数在 C++ 中创建累加器？

haskell - func::也许(Int) -> 也许(Int)
我做了一些研究，但没有找到任何东西。我不明白这样的函数是如何工作的: func :: Maybe (Int) -> Maybe (Int) 我应该如何进行模式匹配？我已经尝试过，但没有成功: func
javascript 缓存(也许)？
我需要从屏幕上删除一个元素，然后重新生成一个具有相同名称的元素。代码中有一个deleteObject函数和一个appendChild调用。在deleteObject函数中，它使用removeChi
Haskell - 也许/只是递归
我读了一些关于 monad 的帖子和博客，也许，只是，什么都没有..但并没有真正明白:/在给定的代码中，我必须实现“latestActivity”函数。在我看来，它应该有效，但我不知道如何正确使用“J
scala - 为什么棱镜设置函数不返回选项/也许
在功能光学中，一个性能良好的棱镜(我相信在 scala 中称为部分透镜)应该具有 'subpart -> 'parent -> 类型的 set 函数'parent，如果棱镜“成功”并且在结构上与给定的
c - 我在分配内存时遇到问题。(也许)
有输入文件；未排序的长类型数字。(约100万)我想对输入文件中的数字进行排序。为了分配数组的内存，我使用了fseek和ftell。但出现段错误。如何修复代码？ int main( int argc,
javascript - 第三次是一个魅力......也许
我仍在尝试从单元格收集信息，使用该信息执行函数，然后将结果返回到不同的单元格。我知道这是可能的，但我正在努力解决这个问题。我在这里收到的许多提示引导我找到了以我理解的方式表达的大量信息。我希望这种事能
java - 可能的范围问题(也许)？
所以我正在制作一个小型命令行彩票游戏(代码中的注释解释了一切)，但是当我生成随机数时，我的代码并没有像我希望的那样将其缩短为三位数，除了游戏可以运行并且可以玩之外，除了偶尔有一个随机生成的数字超过一千
c++ - 空格很重要的另一种情况(也许？)
这是另一种情况，在 C++ 中空格很重要，还是编译器错误？以下代码在语法上是否正确？ #include template using EnableIf = typename std::enable
PHP 应用程序变量...也许？
我参加了一个 PHP 工作面试，我被要求实现一段代码来检测访问者是否是爬行网站并窃取内容的机器人。因此，我实现了几行代码，通过使用 session 变量存储上次访问时间戳来检测网站是否刷新/访问过快
elm - 筛选，也许， Elm
我有一个List (Maybe a)，我想过滤出Nothing的实例。我大概已经做到了，但是对所需的代码量却不满意: removeNothingFromList : List (Maybe a) ->
ontology - 如何安排一个地方的营业时间？也许 - 甚至有一个本体论吗？
有谁知道任何指定场所开放时间的本体？例如，我有一个博物馆，有 2 个季节。淡季(指定季节起止)，平日10-18:00，周六10-16(周日休息)，旺季平日10-20，周末10-18。如果没有本体，也
javascript - jQuery 函数和页面重新加载问题(也许)
我有this代码(接受的解决方案)。此代码从 js 文件中截取加载。当我在此函数处放置断点时，我看到该函数在加载页面(包含它)时被调用。初始页面加载后，当我在此页面中选择一个选项时，该 anchor
haskell - 也许 Haskell 实现
step :: [Int] -> String -> [Int] step (x:y:ys) "*" = (x*y):ys step (x:y:ys) "+" = (x + y):ys step (x
haskell - 具有不同类型短路的状态计算(也许，或者)
我正在尝试找到将以下有状态命令式代码转换为纯函数表示的最优雅的方法(最好在 Haskell 中使用其 Monad 实现提供的抽象)。然而，我还不擅长使用变压器等组合不同的单子(monad)。在我看来，
purescript - 如何将部分函数转换为安全(也许)函数？
我希望它更方便地使用库定义的partialfunc，或者使用部分模式匹配编写回调。像这样， partialMaybe :: forall a b. (Partial => a -> b) -> a
c 编译器有一个函数卡在其命名空间中(也许？)。苹果
一周前，我在代码中编写了一个名为 getline 的函数，但该函数不起作用。从那时起，每当我将函数命名为 getline 并尝试编译它时，它都不起作用。如果我将函数名称更改为其他名称，它会再次起作用。
Android:也许 FEATURE_PROGRESS 导致应用程序不幸停止
下面的代码有问题 package com.example.ch13_searchflickrr; import android.os.Bundle; import android.support.v7
Mysql 内连接(也许)以更新日期为条件
我有这个需求，并且我使用的是MySQl数据库评论表 id user id ariticle_id comment comment date ================
C++ 运行计时 IDE 也许？
是否有 IDE 或软件可以为我的 C++ 程序计时？我目前正在使用 Visual Studio 2010，所以如果有功能可以帮助解决这个问题，我将不胜感激。最佳答案您将需要使用 Profiler。
C#泛型，设计思想，也许
我是 C# 的新手，正在研究它的可能性。现在我对使用泛型的方式有点困惑...列出泛型的种类。我想在单个父类中创建一个基本的列表功能，只需命名我的子类应包含的类类型。比如说，我创建了一个类 clas

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 间歇性 "Aborted Core Dumped"。也许是 static_cast 的错？