performance - 为什么我的Rust程序比等效的Java程序慢？-6ren

performance - 为什么我的Rust程序比等效的Java程序慢？

转载作者：行者123 更新时间：2023-12-03 11:47:07

我在Rust中使用二进制序列化和反序列化，并且发现二进制反序列化比Java慢几个数量级。为了消除例如由于分配和开销引起的开销的可能性，我只是从每个程序中读取一个二进制流。每个程序从磁盘上的一个二进制文件中读取文件，该文件包含一个包含输入值数量的4字节整数，以及一个连续的，由8字节big-endian IEEE 754编码的浮点数的块。这是Java实现:

import java.io.*;

public class ReadBinary {
    public static void main(String[] args) throws Exception {
        DataInputStream input = new DataInputStream(new BufferedInputStream(new FileInputStream(args[0])));
        int inputLength = input.readInt();
        System.out.println("input length: " + inputLength);
        try {
            for (int i = 0; i < inputLength; i++) {
                double d = input.readDouble();
                if (i == inputLength - 1) {
                    System.out.println(d);
                }
            }
        } finally {
            input.close()
        }
    }
}

这是Rust的实现:

use std::fs::File;
use std::io::{BufReader, Read};
use std::path::Path;

fn main() {
    let args = std::env::args_os();
    let fname = args.skip(1).next().unwrap();
    let path = Path::new(&fname);
    let mut file = BufReader::new(File::open(&path).unwrap());
    let input_length: i32 = read_int(&mut file);
    for i in 0..input_length {
        let d = read_double_slow(&mut file);
        if i == input_length - 1 {
            println!("{}", d);
        }
    }
}

fn read_int<R: Read>(input: &mut R) -> i32 {
    let mut bytes = [0; std::mem::size_of::<i32>()];
    input.read_exact(&mut bytes).unwrap();
    i32::from_be_bytes(bytes)
}

fn read_double_slow<R: Read>(input: &mut R) -> f64 {
    let mut bytes = [0; std::mem::size_of::<f64>()];
    input.read_exact(&mut bytes).unwrap();
    f64::from_be_bytes(bytes)
}

我正在输出最后一个值，以确保实际上已读取所有输入。在我的机器上，当文件包含(相同)3000万个随机生成的 double 数据时，Java版本运行时间为0.8秒，而Rust版本运行时间为40.8秒。
由于怀疑Rust的字节解释本身效率低下，我使用自定义浮点反序列化实现重试了它。内部结构是 almost exactly the same as what's being done in Rust's Reader，没有 IoResult包装器:

fn read_double<R : Reader>(input: &mut R, buffer: &mut [u8]) -> f64 {
    use std::mem::transmute;
    match input.read_at_least(8, buffer) {
        Ok(n) => if n > 8 { fail!("n > 8") },
        Err(e) => fail!(e)
    };
    let mut val = 0u64;
    let mut i = 8;
    while i > 0 {
        i -= 1;
        val += buffer[7-i] as u64 << i * 8;
    }
    unsafe {
        transmute::<u64, f64>(val);
    }
}

为了使这项工作有效，我对早期的Rust代码所做的唯一更改是创建了一个8字节的切片，将其传入并(重新)用作 read_double函数中的缓冲区。这产生了显着的性能提升，平均运行时间约为5.6秒。不幸的是，它仍然比Java版本明显慢(并且更冗长!)，从而难以扩展到更大的输入集。是否可以做一些事情以使在Rust中运行起来更快？更重要的是，是否可以通过将这些更改合并到默认 Reader实现本身中的方式进行更改，以减轻二进制I/O的痛苦？
作为引用，这是我用来生成输入文件的代码:

import java.io.*;
import java.util.Random;

public class MakeBinary {
    public static void main(String[] args) throws Exception {
        DataOutputStream output = new DataOutputStream(new BufferedOutputStream(System.out));
        int outputLength = Integer.parseInt(args[0]);
        output.writeInt(outputLength);
        Random rand = new Random();
        for (int i = 0; i < outputLength; i++) {
            output.writeDouble(rand.nextDouble() * 10 + 1);
        }
        output.flush();
    }
}

(请注意，在我的测试计算机上，生成随机数并将其写入磁盘仅需3.8秒。)

最佳答案

当您不进行优化而进行构建时，它通常会比Java中的速度慢。但是通过优化(rustc -O或cargo --release)来构建它，它应该非常快。如果它的标准版本仍然以较慢的速度结束，则应该仔细检查该问题，以找出缓慢的原因-也许正在内联一些不应该，不应该或应该进行的优化。没有发生。

关于performance - 为什么我的Rust程序比等效的Java程序慢？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65364950/

文章推荐： rust - 对存储在向量中的值的引用的生命周期

文章推荐： ide - 如何在 Webstorm 中使文本缩进

python - C 程序比 Python 子进程更快
我有一个用 C 编写的多线程合并排序程序，以及一个使用 0、1、2 或 4 个线程对其进行基准测试的程序。我还用 Python 编写了一个程序来进行多项测试并汇总结果。奇怪的是，当我运行 Pytho
ruby - 为什么我的 rust 程序比 ruby 程序慢？
这个问题在这里已经有了答案: Why is my Rust program slower than the equivalent Java program? (1 个回答) 关闭 5 年前。我用
javascript - 为什么这个 JavaScript 程序比 C++ 更快地填充一个大数组？
关于编译为 JavaScript 的语言的开发，我也在考虑以 C++ 为目标，以便在需要时生成更快的程序。我的计划是使用 std::vectors 来保存我的语言的动态数组。重复填充一个大数组将是一个
fortran - FORTRAN 77 程序比 Fortran 90 程序更快吗？
今天，我正在阅读一些用 FORTRAN 77 编写的非常流行的数值库中的代码，例如 QUADPACK ( last updated in 1987 )，我想知道除了大量的代码之外，是否有任何理由不在
32 位 jvm 上的 Java 程序比 64 位上的慢
我的 Java 程序目前遇到了一个奇怪的行为: 该程序是一个 JavaFX 桌面应用程序，它使用本地 Selenium 独立服务器打开 Web 应用程序，进行一些输入并下载 Excel 文件。它读取
c - OS X 中的多线程 C 程序比 Linux 慢得多
我为我已经完成并提交的 OS 类作业写了这篇文章。我昨天发布了这个问题，但由于“学术诚信”规定，我在提交截止日期之后才将其取消。目标是学习如何使用临界区。有一个 data 数组，其中包含 100 个
rust - 为什么 Rust 程序比 C、Haskell 和 OCaml 版本使用更多的内存？
我查看了 Rust 程序使用了多少 RAM(top 命令的 RES 列)，我想知道为什么它们使用这么多内存。这是一个例子: use std::io; fn main() { println!

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

performance - 为什么我的Rust程序比等效的Java程序慢？