- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
有点相关的问题,一岁:Do any JVM's JIT compilers generate code that uses vectorized floating point instructions?
前言:我正尝试在纯 Java 中执行此操作(没有 JNI 到 C++,没有 GPGPU 工作,等等...)。我已经分析过,大部分处理时间来自此方法中的数学运算(可能是 95% 的 float 学和 5% 的整数数学)。我已经将所有 Math.xxx() 调用减少到一个足够好的近似值,所以现在大部分数学都是浮点乘法和一些加法。
我有一些处理音频处理的代码。我一直在进行调整,并且已经取得了很大的收获。现在我正在研究手动循环展开以查看是否有任何好处(至少在手动展开 2 时,我看到大约有 25% 的改进)。在尝试手动展开 4 时(这开始变得非常复杂,因为我正在展开嵌套循环的两个循环)我想知道是否有什么我可以做的来暗示 jvm 在运行时它可以使用 vector操作(例如 SSE2、AVX 等)。音频的每个样本都可以完全独立于其他样本进行计算,这就是为什么我已经能够看到 25% 的改进(减少对浮点计算的依赖性)。
例如,我有 4 个 float ,一个用于循环的 4 个展开中的每一个,以保存部分计算的值。我如何声明和使用这些 float 重要吗?如果我将它设为 float[4] 是否会向 jvm 暗示它们彼此无关,而不是具有 float、float、float、float 甚至一类 4 个公共(public) float ?有什么我可以毫无意义地做的事情会扼杀我对代码进行矢量化的机会吗?
我在网上看到过关于“正常”编写代码的文章,因为编译器/jvm 知道常见的模式以及如何优化它们,偏离这些模式可能意味着更少的优化。然而,至少在这种情况下,我不希望将循环展开 2 次来提高性能,所以我想知道是否还有其他我可以做的事情(或者至少不能 做)来帮助我的机会。我知道编译器/jvm 只会变得更好,所以我也想警惕将来会伤害我的事情。
为好奇而编辑:展开 4 比展开 2 提高了 ~25% 的性能 另一个,所以我真的认为如果 jvm 支持 vector 操作(或者可能已经支持它) 正在使用它们)。
谢谢!
最佳答案
How can I..audio processing..pure java (no JNI to C++, no GPGPU work, etc...)..use vector operations (e.g. SSE2, AVX, etc...)
Java 是 high level语言(Java 中的一条指令生成许多硬件指令)是设计使然(例如垃圾收集器内存管理),不适合实时处理大量数据的任务。
通常有针对特定角色优化的特殊硬件(例如 image processing 或 speech recognition),它们多次通过几个简化的处理管道利用并行化。
这类任务也有专门的编程语言,主要是hardware description languages和 assembly language .
即使是 C++(被认为是快速语言)也不会自动为您使用一些 super 优化的硬件操作。它可能只是在某些地方内联了几种手工制作的汇编语言方法中的一种。
所以我的回答是,“可能没有办法”指示 JVM 对您的代码使用一些硬件优化(例如 SSE ),即使有一些 Java 语言运行时仍然会有太多其他因素会降低您的代码速度。
使用为此任务设计的低级语言并将其链接到 Java 以实现高级逻辑。
编辑:根据评论添加更多信息
如果您确信高级“一次编写随处运行”的语言运行时肯定也应该为您做很多低级优化并自动将您的高级代码转换为优化的低级代码那么......方式JIT 编译器优化取决于 Java Virtual Machine 的实现.有很多。
如果是 Oracle JVM (HotSpot),您可以通过 downloading the source code 开始寻找答案。 ,文本 SSE2
出现在以下文件中:
它们是用 C++ 和汇编语言编写的,因此无论如何您都必须学习一些低级语言才能阅读它们。
即使有 +500 赏金,我也不会猎到那么深。恕我直言,问题是基于错误的假设是错误的
关于java - 我如何编写代码来提示 JVM 使用 vector 操作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23450352/
是否可以复制一个完整的 JVM,并且在故障转移的情况下只需将负载转移到复制的 JVM 上? 如果是,那我们该怎么做呢? 最佳答案 如果您的应用程序是 Web 应用程序,请阅读“集群”和“负载平衡”。大
我读了下面的话,但我想知道它们之间的区别...... JVM 规范、JVM 实现、JVM 运行时 最佳答案 JVM 规范:描述 JVM 应如何运行的文档。 JVM 实现:基于 JVM 规范的 JVM
我目前有四个不同的 java 应用程序,它们由 .bat 文件启动的 jar 运行,这些文件位于 Windows XP Embedded 开始菜单的 starup 文件夹中。我还启动了 Firefox
有人能给我一些关于强制 64 位 jvm 作为 32 位 jvm 运行的想法吗? 我需要为蓝牙连接编写一个 jse 桌面应用程序。为此,我需要实现 Bluecove jar 。它只有 32 位文件。所
我看到过关于这个问题的多条评论——有人说是,有人说不是,许多答案模棱两可。任何人都可以用更简单的术语描述它所在的位置吗?在一篇文章中,我什至看到有人说它与类加载器加载类的类内存共享相同的内存位置 -
我正在寻找所有可能的 jvm 退出代码的完整列表(不是 java System.exit(x))。我使用搜索引擎唯一能找到的是 SIGTERM 退出代码列表:http://journal.thobe.
为了监视任何正常的 Java 进程 JVM,我们可以使用 Attach API。是否有可用于监控 WebSphere JVM 的 API? 最佳答案 您可以使用 PMI(性能监控基础设施)来监控 JV
这个问题在这里已经有了答案: 8年前关闭。 Possible Duplicate: Java - C-Like Fork? 我想知道如何从 JDK fork 子 JVM,甚至有可能这样做吗? 一些框架
JVM 上的哪些图灵完备语言实现不使用 JVM 堆栈作为调用堆栈? (我问是因为我想在同一个线程中实现 Scala 和另一种语言之间的协程。) 最佳答案 闪蝶 SISC(方案代码的第二解释者) 曾经不
我看到here除了 Java 之外,还有很多语言可以在 JVM 上运行。我对在 JVM 中运行的其他语言的整个概念有些困惑。所以: 为 JVM 使用其他语言有什么优势? 为 JVM 编写语言/编译器需
我已经运行了 straced JVM (OpendJDK 11): strace -e trace=mmap java -Xms8192m Main 输出是: mmap(NULL, 8192, PRO
我已经运行了 straced JVM (OpendJDK 11): strace -e trace=mmap java -Xms8192m Main 输出是: mmap(NULL, 8192, PRO
我编写了一个简单的数独求解器。为了粗略测试性能,我使用简单的 System.currentTimeMillis 调用。 我在文本文件中准备了一组初始数独配置。该程序读取该文件并解决每个数独配置。运行测
JVM 被广泛使用:Scala、Groovy、Jython 等。我听说它被描述为“卓越”、“出色”和“严重低估”。为什么? 更具体地说,是什么让 JVM 独一无二?随着所有资金投入 .NET,或者 C
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Are there any Java VMs which can save their state to a fi
想象一下 6-7 台服务器的设置都完全相同Java 版本“1.6.0_18”OpenJDK 运行时环境 (IcedTea6 1.8) (fedora-36.b18.fc11-i386)OpenJDK
(如有错误请指正) 我了解到,当您通过发出 java 命令来运行 java 程序时, java MyProg 程序将在新的 JVM 上运行。 什么将程序加载到新的 JVM 中?是生成新线程的 JRE
我们有一个使用 JNI 的桌面应用程序偶尔会导致 JVM 崩溃。幸运的是,JVM 会生成一个 hs_err_pidXXXX.log 文件,这对于调试此类错误非常有用。然而,它似乎总是转到当前工作目录,
我在命令提示符下运行一个程序集 jar 文件并得到下面的异常。并导致终止。 Uncaught error from thread [ccp-akka.persistence.dispatchers.d
一、什么是Java虚拟机 虚拟机:指以软件的方式模拟具有完整硬件系统功能、运行在一个完全隔离环境中的完整计算机系统 ,是物理机的软件实现。常用的虚拟机有VMWare,Visual Box,Java
我是一名优秀的程序员,十分优秀!