- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
下面是我如何将字符串压缩到一个文件中:
public static void compressRawText(File outFile, String src) {
FileOutputStream fo = null;
GZIPOutputStream gz = null;
try {
fo = new FileOutputStream(outFile);
gz = new GZIPOutputStream(fo);
gz.write(src.getBytes());
gz.flush();
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
gz.close();
fo.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
解压方法如下:
static int BUFFER_SIZE = 8 * 1024;
static int STRING_SIZE = 2 * 1024 * 1024;
public static String decompressRawText(File inFile) {
InputStream in = null;
InputStreamReader isr = null;
StringBuilder sb = new StringBuilder(STRING_SIZE);//constant resizing is costly, so set the STRING_SIZE
try {
in = new FileInputStream(inFile);
in = new BufferedInputStream(in, BUFFER_SIZE);
in = new GZIPInputStream(in, BUFFER_SIZE);
isr = new InputStreamReader(in);
char[] cbuf = new char[BUFFER_SIZE];
int length = 0;
while ((length = isr.read(cbuf)) != -1) {
sb.append(cbuf, 0, length);
}
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
in.close();
} catch (Exception e1) {
e1.printStackTrace();
}
}
return sb.toString();
}
减压似乎要花很长时间。我有一种感觉,我在减压位上做了太多多余的步骤。知道如何加快速度吗?
编辑:已根据以下给出的建议将代码修改为上述代码,
1. 我改变了模式,所以我的代码有点简单,但是如果我不能使用 IOUtils
是否仍然可以使用这个模式?
2. 我按照entonio
的建议将StringBuilder buffer设置为2M,是否应该设置多一点?内存还可以,我仍然有大约 10M 可用,因为 eclipse 的堆监视器建议3. 我砍掉了BufferedReader 并添加了一个BufferedInputStream,但我仍然不确定BUFFER_SIZE,有什么建议吗?
上述修改已将我所有 30 个 2M 文件的循环时间从将近 30 秒缩短到大约 14 秒,但我需要将其减少到 10 秒以下,这在 Android 上是否可行?好的,基本上,我需要处理所有 60M 的文本文件,我将它们分成 30 个 2M,在我开始处理每个字符串之前,我做了上面的时间成本计时,只是为了循环所有文件并将文件中的字符串获取到我的内存中。由于我没有太多经验,如果我用1M文件中的60个代替会更好吗?或者我应该采用任何其他改进?谢谢。
另外:由于物理 IO 非常耗时,而且我的压缩版本文件都非常小(2M 文本中大约 2K),我是否仍可以执行上述操作,但是在一个文件上已经映射到内存?可能使用java NIO?谢谢
最佳答案
BufferedReader
的唯一用途是您不使用的 readLine()
方法,所以为什么不直接从 InputStreamReader
读取?此外,也许减小缓冲区大小可能会有所帮助。此外,您可能应该在读取和写入时指定编码,尽管这不会对性能产生影响。
编辑:更多数据
如果您知道前面字符串的大小,您应该在decompressRawText
中添加一个长度参数,并用它来初始化StringBuilder
。否则,它会不断调整大小以适应结果,而且代价高昂。
编辑:澄清
2MB 意味着需要进行大量调整。如果您指定的容量大于读取后的最终长度(当然暂时使用更多内存除外),也没有什么坏处。
关于java: 将文件解压成字符串太慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6012097/
我希望通过扫描线为 x 的每个值找到 y 的值来绘制椭圆。 对于普通椭圆,公式很容易找到:y = Sqrt[b^2 - (b^2 x^2)/a^2] 但是当椭圆的轴旋转时,我一直无法弄清楚如何计算 y
假设我有这个矩阵: 1 1 1 | 1 0 0 1 | 1 这个系统显然有无限的解决方案。 x1 = -x2 x3 = 1 x1 依赖于 x2,x2 是免费的,但我感兴趣的是 x3。是否有一种算法可以
我正在考虑使用神经网络在我正在构建的太空射击游戏中为我的敌人提供动力,我想知道;当网络没有一个明确的好的输出集时,你如何训练神经网络? 最佳答案 我目前正在研究神经网络,如果没有明确定义的输入和输出编
我需要一个针对受限资源环境(例如具有以下特征的二进制(十六进制数据)嵌入式系统)进行优化的快速解压缩例程: 数据面向 8 位(字节)(数据总线为 8 位宽)。 字节值的范围并不统一为 0 - 0xFF
PHP代码: $txt="John has cat and dog."; //plain text $txt=base64_encode($txt); //base64 encode $txt=gzd
程序从用户那里接收到一个正数k,并且应该检查方程有多少解 3*x+5*y=k 在许多解决方案的情况下,该函数采用所有解决方案中 |x-y| 的较大绝对值。如果只有一种解决方案,它会打印出来。例如: 如
我必须求解以下微分方程: 或 如果没有 F_1 术语,代码就很简单。但我无法用包含 F_1 项来解决它,尽管我知道解决方案应该看起来像阻尼谐振。 from scipy.integrate import
我知道这个问题是前缀和的变体,我只是在设置它时遇到了一些困难。 最佳答案 定义: P[i] = A[i+1] + A[i+2] + ... + A[n] Q[i] = A[1] + ... + A[i
在许多在线示例中,文件在 Java 中使用编码缓冲区进行(解)压缩。然而,对于 NIO,无需选择一个好的缓冲区大小。我找到了文件和套接字的示例,但是是否有用于压缩输入的 NIO channel (例如
我有一个形式为 A*x = B 的方程组,其中 [A] 是一个三对角系数矩阵。使用 Numpy 求解器 numpy.linalg.solve 我可以求解 x 的方程组。 请参阅下面的示例,了解我如何开
我试图回答这个问题,只使用递归(动态编程) http://en.wikipedia.org/wiki/Longest_increasing_subsequence 从这篇文章中,我意识到最有效的现有解
解决此问题的方法是,按照我发帖的其中一项建议,将DLL添加到GAC中。正如我在我的一份答复中所指出的那样,在需要运行此过程的环境中,可伸缩性将不可用。因此,不能选择简单的解决方案。为了解决这个问题,我
是否有专门描述 AAC-LC 标准的规范,以及实现编解码器的现实目标,而不是通用编解码器,而是针对特定 AAC-LC 格式,具有预定义的 channel 数和采样率? 是否有一些针对 AAC-LC 的
我想使用通用的“p”来定义多路复用器将有多少输出。输入和所有输出均为 1 位。输出、控制和输入可以很简单,例如: signal control : std_logic_vector(log 2 p
我正在尝试在 javascript 中使用一些三 Angular 函数来定位一些菱形 div,但似乎我的逻辑在某处失败了。 你可以看到我尝试了这个公式:pos + trig * dimension。我
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
我一直在考虑这两个 JSON 库: 谷歌 Gson JSON.Simple XStream Google Gson 非常棒,它可以序列化具有无参数构造函数的类对象。 JSON.Simple 非常简洁,
使用 Gekko 拟合数据的数值 ODE 解。 嗨,大家好! 我想知道是否可以使用 GEKKO 拟合 ODE 的系数。 我尝试复制 example given here 失败. 这是我想出的(但有缺陷
众所周知,ASCII使用7位来编码字符,所以用来表示文本的字节数总是小于文本字母的长度 例如: StringBuilder text = new StringBuilder(); In
我找到了一个 link其中显示了一个示例,当线性方程组有无限多个解时,Matlab mldivide 运算符 (\) 给出“特殊”解。 例如: A = [1 2 0; 0 4 3]; b = [8;
我是一名优秀的程序员,十分优秀!