- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我编写了以下程序来比较 python 和 c/fortran 的速度。为了获得程序使用的时间,我使用了“时间”命令。所有程序计算 xx+yy+z*z 的平方根,其中 x、y、z 是 float 。我使用了平方根,因为它是最耗时的部分之一科学计算,我参与其中。
我有以下时间:
fortran 0m29.9s //
c 0m20.7s //
python 30m10.8s
根据我做的简单测试发现Python不推荐用于科学计算。但可能我的代码效率很低。
您认为我可以仅针对这个简单的测试用例提高我的代码的效率吗?
语言:
program root_square
implicit none
integer i,j
real x,y,z,r
x=1.0
y=2.0
z=3.0
do j=1,3000
do i=1,1000000
r=sqrt(x*x+y*y+z*z)
enddo
enddo
end program root_square
C:
#include "stdio.h"
#include "math.h"
int main (void)
{
float x=1.0,y=2.0,z=3.0,r;
int i,j;
for(j=0; j<3000; j++){
for(i=0; i<1000000; i++) {
r=sqrt(x*x+y*y+z*z);
}
}
return 0;
}
python :
#!/usr/bin/env python
from math import sqrt
x = 1.0
y = 2.0
z = 3.0
for j in range(1,3001):
for i in range(1,1000001):
r = sqrt(x*x+y*y+z*z)
最佳答案
我最近做了a similar test使用更现实的现实世界算法。它涉及 numpy、Matlab、FORTRAN 和 C#(来自 ILNumerics)。如果没有特定的优化,numpy 生成的代码似乎比其他代码效率低得多。当然——一如既往——这只能表明一种普遍趋势。您将能够编写最终运行速度比相应的 numpy 实现慢的 FORTRAN 代码。但大多数时候,numpy 会慢得多。这是我测试的(平均)结果:
为了像您的示例中这样简单的浮点运算计时,一切都归结为编译器生成“最佳”机器指令的能力。在这里,涉及多少编译步骤并不重要。 .NET 和 numpy 通过首先编译为字节码然后在虚拟机中执行来利用多个步骤。但优化结果的选项同样存在——理论上。在实践中,现代 FORTRAN 和 C 编译器在优化执行速度方面做得更好。例如,他们利用浮点扩展(SSE、AVX)并进行更好的循环展开。 numpy(或更好的 CPython,主要由 numpy 使用)在这一点上似乎表现更差。如果您想确保哪个框架最适合您的任务,您可以附加调试器并调查可执行文件的最终机器指令。
但是,请记住,在更现实的场景中,浮点性能仅在大型优化链的末端才重要。这种差异通常被更强大的影响所掩盖:内存带宽。一旦你开始处理数组(这在大多数科学应用中很常见),你就必须考虑内存管理的成本。框架在支持算法作者编写内存高效算法方面有所不同。在我看来,numpy 使得编写内存高效算法比 FORTRAN 或 C 更难。但在任何这些语言中都不容易。 (ILNumerics 大大改善了这一点。)
另一个重点是并行化。该框架是否支持您并行执行计算?它的效率如何?还是我个人的观点:C、FORTRAN 和 numpy 都不能轻松地并行化你的算法。但是 FORTRAN 和 C 至少给了你这样做的机会,即使它有时需要使用特殊的编译器。其他框架(ILNumerics、Matlab)会自动并行化。
如果您需要非常小但昂贵的算法的“峰值性能”,您最好使用 FORTRAN 或 C。只是因为它们最终会生成更好的机器代码(在单处理器系统上)。然而,在考虑内存效率和并行性的情况下,用 C 或 FORTRAN 编写更大的算法通常会变得很麻烦。在这里,高级语言(如 numpy、ILNumerics 或 Matlab)胜过低级语言。如果做得对 - 执行速度的差异通常可以忽略不计。不幸的是,对于 numpy 的情况通常不是这样。
关于python - 将 python 与 c/fortran 进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9439869/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!