- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我在我的程序中做了很多散列,所以我决定破解一个 constexpr 函数,它至少可以在编译时为我做一些散列。成功实现 constexpr 哈希函数后,我分析了代码,发现它实际上很花时间——这很奇怪,因为计算应该发生在编译时,而不是运行时。使用 G++ 4.7.3。
下面是 gprof 的一些输出,以及一个完整的演示程序,由于 constexpr 函数难以阅读,因此使用了非 constexpr 实现,同时也展示了它的工作原理。
我从以下链接中获取了建议,并将 char 数组设为 constexpr 和 const: why is a const array not accessible from a constexpr function?
注意:已从代码中删除一些内容以简化演示,例如测试和断言。
1.) 我的 constexpr 函数是否在运行时执行? (对我来说似乎很明显)
2.) 如果是,为什么?我如何让它在编译时而不是运行时执行?
gprof:
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls us/call us/call name
50.00 0.06 0.06 600012 0.09 0.09 string_length(char const*, unsigned int)
36.36 0.10 0.04 50001 0.80 2.20 HASHOAT_CONSTEXPR(char const*, unsigned int, unsigned int, unsigned int)
9.09 0.10 0.01 1100022 0.01 0.01 oat_part_two(unsigned int const&)
4.55 0.11 0.01 50001 0.10 0.10 oat_part_six(unsigned int const&)
0.00 0.11 0.00 1650033 0.00 0.00 oat_part_one(unsigned int const&, char)
0.00 0.11 0.00 550011 0.00 0.00 oat_part_three(unsigned int const&)
0.00 0.11 0.00 200004 0.00 0.00 oat_part_four(unsigned int const&)
0.00 0.11 0.00 100002 0.00 0.00 oat_part_five(unsigned int const&)
0.00 0.11 0.00 1 0.00 0.00 HashOAT(char const*, unsigned int)
演示程序:
#include <cstdio>
#include <cstring>
// "One-at-a-time" Hash
// the non-constexpr implementation:
unsigned int HashOAT( const char *key, const unsigned int size = 1009 ); // size must be prime
unsigned int HashOAT( const char *key, const unsigned int size ) {
unsigned int h = 0;
const std::size_t len = strlen(key);
for ( std::size_t i = 0; i < len; ++i ) {
h += static_cast< unsigned int >( key[i] );
h += ( h << 10 );
h ^= ( h >> 6 );
}
h += ( h << 3 );
h ^= ( h >> 11 );
h += ( h << 15 );
return h % size;
}
constexpr unsigned int HASHOAT_CONSTEXPR( const char* str, const std::size_t size=1009, const std::size_t idx=0, const std::size_t h=0 );
constexpr unsigned int oat_part_one( const std::size_t& h, const char c );
constexpr unsigned int oat_part_two( const std::size_t& h );
constexpr unsigned int oat_part_three( const std::size_t& h );
constexpr unsigned int oat_part_four( const std::size_t& h );
constexpr unsigned int oat_part_five( const std::size_t& h );
constexpr unsigned int oat_part_six( const std::size_t& h );
constexpr unsigned int oat_part_one( const std::size_t& h, const char c ) {
return ( h + static_cast<unsigned int>( c ) );
}
constexpr unsigned int oat_part_two( const std::size_t& h ) {
return ( h << 10 );
}
constexpr unsigned int oat_part_three( const std::size_t& h ) {
return ( h >> 6 );
}
constexpr unsigned int oat_part_four( const std::size_t& h ) {
return ( h << 3 );
}
constexpr unsigned int oat_part_five( const std::size_t& h ) {
return ( h >> 11 );
}
constexpr unsigned int oat_part_six( const std::size_t& h ) {
return ( h << 15 );
}
constexpr std::size_t string_length( const char* str, std::size_t index = 0 ) {
return ( str == nullptr || str[index] == '\0' ) ? 0 : 1 + string_length( str, index+1 );
}
constexpr unsigned int HASHOAT_CONSTEXPR( const char* str, const std::size_t size, const std::size_t idx, const std::size_t h ) {
return (
( idx == string_length( str ) ) ? (
(
(
( h + oat_part_four( h ) ) ^
oat_part_five( h + oat_part_four( h ) )
) +
oat_part_six(
( h + oat_part_four( h ) ) ^
oat_part_five( h + oat_part_four( h ) )
)
) % size
) : (
HASHOAT_CONSTEXPR( str, size, idx+1,
(
oat_part_one( h, str[idx] ) +
oat_part_two( h + static_cast< unsigned int>( str[idx] ) )
) ^
oat_part_three( oat_part_one( h, str[idx] ) +
oat_part_two( oat_part_one( h, str[idx] ) )
)
)
)
);
}
int main ( void ) {
constexpr const char* str="Some String";
printf("Hash: %i\n", HashOAT(str) );
printf("Hash: %i\n", HASHOAT_CONSTEXPR(str) );
// make the program take some time so we can see if the constexpr function is actually taking run-time
for ( int i=0; i<50000; ++i ) {
HASHOAT_CONSTEXPR(str);
}
return 0;
}
最佳答案
20 天过去了,没有任何人回答,所以我决定深入挖掘一下。
我想到在编译时尝试各种优化级别(使用 g++ -O#)
我将 for 循环迭代了几百万次(在相当老的计算机上),并在优化级别 0、1、2、3 和 4 上计时执行。
我还编译成 ASM(使用 G++ -S)并检查程序生成的程序集。
我得出的结论是,constexpr 函数,或者可能特别复杂的 constexpr 函数,在低于 2 的任何优化级别上都被视为普通函数。在 2 级或更高级别,G++ 在编译时评估函数,并且它们没有进入可执行文件(通过检查程序集。asm 文件要短得多)。完全优化的可执行文件在不到一秒的时间内完成执行,而未优化的可执行文件花费了大约十倍的时间。此外,优化后的可执行文件在使用 gprof 进行分析时,未在其输出中显示任何 constexpr 函数。
底线是 constexpr 仅在以优化级别 2 或更高级别编译时在编译时进行评估。
关于c++ - 使用 const char 数组参数分析 constexpr 显示运行时执行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19072539/
这个问题在这里已经有了答案: Why don't Java's +=, -=, *=, /= compound assignment operators require casting? (11 个
当我尝试运行以下代码时,List(.of) 无法编译并给出主题错误。 package collections; import java.util.LinkedHashSet; import java.
我正在尝试编译使用 ChatScript 库的程序。这是我在名为 main.cpp 的文件中的代码: #include #include "common.h" using namespace std
我想在我的程序中外部使用 ChatScript。在documents它说: Embedding Step #1 First, you will need to modify `common.h and
假设我有一个 char,我想用一行代码将其 strcat() 转换为 char 数组。对于 [一个非实用的] 示例: strcat("ljsdflusdfg",getchar()); 或者我想做相反的
我有以下类型签名: *Main Lib> let f :: a -> a -> a -> a; f = undefined *Main Lib> let x :: Char; x = undefin
我正在学习如何在 C 中使用指针(使用 malloc 和 free),但我在这个练习中遇到了一些麻烦。我只想制作一个指针数组,我想在其中保存每个单词的方向。然后我想为一个特定的词做一个 free(),
我有一个字符*: char* version = "10.5.108"; 我想通过字符分隔符获取两个新的 char*。 char delimiter = '.'; 执行以下代码后: printf("|
最近在学习Cpp,今天在学习使用Clion做测试的时候,发生了奇怪的事情。 这是我的代码 int main() { char c = 'b'; char carr[1]{'a'};
我对 c 很陌生,我正在审查一些代码。我遇到了这个: static char * fromDataType; static char * toDataType; static char * fromR
我有一个像这样的动态结构: struct network { int count; char** ips; } 如果我知道每个字符串数组都是 16 个字节(即 INET_ADDRSTR
我有一个旧程序,其中使用了一些库函数,但我没有那个库。 所以我正在使用 C++ 库编写该程序。在那个旧代码中有一些函数是这样调用的 *string = newstrdup("这里有一些字符串"); 字
我正在编写一个函数,该函数接受 ArrayList,然后将每个 char[] 复制到另一个增加长度的 char[] 中,然后将新的 char[] 添加到新的 ArrayList 中。当我尝试复制数组时
我正在寻找 map >并生成每个可能的 map从它。 我知道这可能会占用大量内存并需要一些时间。 每个map需要包含每个字母 a-z,并映射到唯一的 a-z 字符。 IE。啊bjcp迪EVfh嘎血红蛋
#define NAME_LEN 20 #include "stdio.h" #include "stdlib.h" #include "string.h" #pragma warning(disab
所以我必须创建一个函数来找到一对带有第一个字母并返回第二个字母的函数。 我实际上找到了一个答案,但是使用 map 功能却找不到。 lookUp :: Char -> [(Char, Cha
我最近接受采访并要求写mystrcat(*s1, *s2, *s3) 其中s1 和s2 是源字符串连接结果由 s3 给出。有人告诉我,不要担心 s3 的内存分配,并假设 s1 和 s2 不是空/无效字
今天我与一位同事讨论了他(对我来说)不寻常的“main”函数签名。他喜欢这样声明: int main(int argc, char* (*argv)[]) { printf("at index
这个问题在这里已经有了答案: 关闭 12 年前。 Possible Duplicate: What's the difference between new char[10] and new cha
通常字符串文字是 const char[] 类型。但是当我把它当作其他类型时,我得到了奇怪的结果。 unsigned char *a = "\355\1\23"; 使用此编译器会抛出警告“初始化中的指
我是一名优秀的程序员,十分优秀!