- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在建立一个深层神经网络来玩connect-4,它必须在一台非常有限的机器上与其他AI机器人竞争(尚不知道具体的限制,只是我只有几个核心和少量的核心记忆)。因此,我希望以任何可能的方式优化我的训练集。目前,它代表董事会中的州:b
代表空白(无片段)x
表示“ x”个o
表示“ o”个win
获胜设置loss
丢失设置draw
用于绘制设置
本质上,我正在尝试对其进行映射,以便我的3位整数可以代替这些占用大量内存的字符串。我考虑过要使用short
,但是它比16位的char
差。我想这样映射它:000
-> b
001
-> x
010
-> o
011
-> win
100
-> loss
101
-> draw
因为我可以用3位而不是char(每个char 8位,yikes!)来表示这些状态,所以我想尝试一下。但是我不确定如何在c中实例化这样的变量。
训练集为67557行,每行代表6x7的木板,其后有赢/输/平局条款。因此,每个字符节省5位将节省每行(5*6*7)+(5*1) = 215
位和整体215*67557 = 14524755
位(共1.90 MB,共2.90 MB,总空间减少了62%)。
最佳答案
您在这里有两三个要合并的不同内容。
训练文件格式
解析后的训练集的内存存储格式(如果您需要保留解析后的状态以备将来参考)
单板状态的解压缩表示形式+可选? W / L / D标志
所有这三种格式都可以不同。培训文件可以是易于编辑的文本。当然,即使您的主程序以二进制格式读取训练集,也可以使用单独的工具从易于编辑的文本格式“编译”该二进制文件。
内部说明用于单个董事会职位:
这需要快速访问和循环。由于您是在训练神经网络,而不是直接编写AI,因此您可能不需要非常处理这种表示形式。如果只需要将每个元素应用于神经网络输入而无需做太多事情,那就没有别的格式了:直接从更紧凑的表示形式直接解压缩到神经网络输入。
但是,如果必须多次遍历单个板状态,则可以选择一些有趣的方法。正如许多人指出的那样,赢/输/平/未定标志应与董事会状态分开考虑。因此,每个板将有一个标志,而不是在每个板位置都存储该标志。
位板:例如,我已经了解过使用64位unsigned int存储所有白色棋子的象棋引擎(例如,狡猾的国际象棋引擎)。您可以对位图进行按位“或”运算,以查找所有白色部分的位置。
位图(一个用于o
,一个用于x
)将记录整个状态。 connect-4板具有6 * 7网格位置,因此每个位图可以是64位,但是32b太小。 popcount(board.o)
告诉您板上有多少个操作系统。 assert(o & x == 0)
将是一个很好的检查方法,因为不可能在同一位置出现o和x。
在结构中使用两个压缩的42b字段将是一个坏主意,因为加载/存储会很慢。即使将它们打包到48位字段中(因此它们以字节边界结尾)也将导致加载/存储速度变慢。请记住,这是我们的快速格式。我们可以使用打包格式进行长期存储。
像board[0][0] && board[0][1] && board[0][2] && board[0][3]
这样的东西(尽管不是这种语法)在编译时位置恒定,在位板上非常快。一个按位与运算仅保留那些可能设置的位,然后可以与掩码进行比较以查看是否所有位都已设置。要测试||
而不是&&
,请省略第二步。您可以对o或x位图或o|x
进行这些测试,以检查其中的任何一种。但是,如果您必须在运行时从可变位置构建遮罩,则效率不高。
要扫描棋盘上是否有赢球,您可以检查左列,然后将遮罩移位,以便检查下一个列。实际上,像这样用蛮力检查所有列可能比检查标记的邻居(寻找2合一候选)要慢。
如果位图是全64位(代表8x8电路板),则某些操作可能会更容易,但实际上您仅使用其左下角的7x6。这样,单独的列位于64位整数的单独字节中。将每一列放在一个单独的字节中可能比行更有用,因为找到一列中使用率最高的位置是您可能想做的事情。这只是该列上的find first set bit操作。从位图中提取8位块的速度更快(不需要屏蔽)。不过,您可以解压缩一个42位的位图以分隔每一列的变量。在x86上,前4个寄存器可针对第一个和第二个8位块(AX(RAX的low16)由AL和AH组成)进行字节寻址,您(或编译器)可能不是那么聪明)可以在4个寄存器中存储7列,并且仍然能够分别bsr
(位扫描反向)任何列。
// Sample bitboard implementation:
struct game_state {
struct board_state {
uint64_t o, x;
} board;
enum winlose { GAME_UNDECIDED=0, GAME_WIN_O, GAME_WIN_X, GAME_DRAW } victory;
};
board[row][col]
syntax in C,并且42 * 2位不适合单个寄存器。交织位板没有任何优势,尤其会使某些事情变得更糟。因为整个内容都不适合64位。 (如果要在位板版本中查找未占用的空间,请在
o|x
中查找零位。在这里,您必须检查每两对2位,而不是能够逐位使用一个位来解决整个问题仍然,您可以创建一个宏来移位/屏蔽表示给定行/列的2位,但这不会产生有效的代码。
board[i][j] && board[i][j+1]
,以便将感兴趣的两条线对齐,然后按位与,然后对该位进行位测试。至少在x86上,存在具有较小字节偏移量的寻址模式,因此,给定一个板卡位置的地址,与另一个板卡位置进行“与”运算可能只需要一条指令。
// Sample byte-array implementation:
enum boardpos {
POS_EMPTY = 0,
POS_O = 1<<0,
POS_X = 1<<1,
POS_OCCUPIED = 1<<3
};
// maybe #define for these constants instead?
struct game_state {
struct board_state {
uint8_t pos[6][7];
} board;
enum winlose { GAME_UNDECIDED=0, GAME_WIN_O, GAME_WIN_X, GAME_DRAW } victory;
// or maybe stuff the winlose info into the high bits of board.pos[0][0]?
// Not much point, since the struct will probably be the same size after padding anyway.
};
xbbb...ooxbbw
是更紧凑但仍易于使用的格式。这样,您就不必将行解析为字符串,就像将其解析为一个恒定大小的43个字符的块一样(如果每个记录用换行符分隔,则为43)。如果您的董事会职位不是赢家,输家或平局,请使用其他字符进行标记。空格或
'n'
。
xb2o1xb1w
)可能会带来更多收益。看到数字意味着重复最后一个字符多次。也许
x
表示一个x,大写字母
X
表示两个x。到了一个让人难以阅读的地步。 LZOP或LZ4压缩可能会很好地压缩内容。
o
和
x
板以及w / d / d状态适合12字节,如果您喜欢整数,则适合16字节。 。
// do some pre-processor stuff to choose between GNU C __attribute__ ((__packed__))
// and the MSVC #pragma pack
struct __attribute__ ((__packed__)) compact_game_state {
struct __attribute__ ((__packed__)) compact_board_state {
uint64_t o:42, x:42;
} board; // sizeof = 11
uint8_t victory;
}; // sizeof = 12
struct semi_compact_game_state {
struct __attribute__ ((__packed__)) semi_compact_board_state {
uint64_t o:48, x:48;
} board; // 96 bits = 12 bytes
enum winlose victory; // another 4 bytes
};
{ POS_EMPTY, POS_O|POS_OCCUPIED, POS_X|POS_OCCUPIED }
查找表的索引。然后位移两位以将下一个场置于低位。该开发板占用84位,因此需要单独的32位或64位块。不需要进行128位双移位。赢/输/平局信息可以进入最后的2位块。
关于c - c中的3位无符号整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32883429/
我正在尝试学习 Fortran,并且看到了很多不同的定义,我想知道他们是否正在尝试完成同样的事情。以下有什么区别? 整数*4 整数(4) 整数(kind=4) 最佳答案 在 Fortran >=90
我以前从未编程过,最近(1 周前)才开始学习!第一门类(class)是函数式编程,使用 Haskell。 我有一项学校作业,我想通过删除一两个步骤来改进它,但我遇到了一个讨厌的错误。 基本上,我创建了
给定以下GraphQL请求和变量: 请求: query accounts($filter:AccountFilter, $first_:String, $skip_:Int) { accounts
我已经搜索了 StackOverflow,但找不到关于如何检查计算器应用程序的数字输入正则表达式的答案,该计算器应用程序将检查每个 keyup 的以下格式(jquery key up): 任何整数,例
类似于我上一篇致歉的文章,但没有那么长篇大论。基本上我想知道当每次重绘调用只重绘屏幕的一小部分时,优化重绘到 JFrame/JPanel 的最佳选择是什么。 此外,除了重绘重载之外,我并不是 100%
所以在我的教科书中有一个使用 f# 的递归函数的例子 let rec gcd = function | (0,n) -> n | (m,n) -> gcd(n % m,m);; 使用此功能,我的教科书
我有一个数据结构,例如表达式树或图形。我想添加一些“测量”功能,例如depth和 size . 如何最好地键入这些函数? 我认为以下三个变体的用处大致相同: depth :: Expr -> Int
这样写比较好 int primitive1 = 3, primitive2 = 4; Integer a = new Integer(primitive1); Integer b = new Inte
我是 Java 8 新手,想根据键对 Map 进行排序,然后在值内对每个列表进行排序。 我试图寻找一种 Java 8 方法来对键和值进行排序。HashMap>映射 map.entrySet().str
这就是我的目标... vector ,int> > var_name (x, pair (y),int>); 其中 x 是 vector var_name 的大小,y 是对内 vector 的大小。
这里是 an answer to "How do I instantiate a Queue object in java?" , Queue is an interface. You can't i
这个问题在这里已经有了答案: Weird Integer boxing in Java (12 个答案) Why are autoboxed Integers and .getClass() val
我们可以使用 C++ STL 做这样的事情吗?如果是,我将如何初始化元素?我试图这样做,但没有成功。 pair,vector>p; p.first[0]=2; 最佳答案 Can we do som
您好,我正在尝试为百分比和整数数组中的数字找到索引。假设 arraynum = ['10%','250','20%','500'] 并且用户发送一个值 15%,这个数字在哪个范围内居住?我可以使用这段
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如,当apple(ProductName)是fruit(Cate
我已经坚持了一段时间,我正在尝试将一些数据配对在一起。这是我的代码。 #include #include using namespace std; int main() { pair data(
我收到错误:'(Int, Int)' 与 'CGPoint' 不相同 如何将 (Int, Int) 转换为 CGPoint let zigzag = [(100,100), (100,150)
我在 .cpp 文件中发现了以下代码。我不理解涉及头文件的构造或语法。我确实认识到这些特定的头文件与 Android NDK 相关。但是,我认为这个问题是关于 C++ 语法的一般问题。这些在某种程度上
我将这些输入到 Scala 解释器中: val a : Integer = 1; val b : Integer = a + 1; 我收到消息: :5: error: type mismatch;
C++:vector>v(size);当我试图打印出值时显示 0 作为值,但是当未声明 vector 大小时它显示正确的输出?为什么这样?例如: int x; cin>>x; vector>v(x);
我是一名优秀的程序员,十分优秀!