- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个 gzip 文件,其中包含一个需要清理的 txt 文件。我想逐行读取 GZip 文件,然后像这样一次性将清理后的内容写入输出 GZIP 文件:
void ExtractAndFix(string inputPath, string outputPath) {
StringBuilder sbLine = new StringBuilder();
using (GZipStream gzInput = new GZipStream(new FileStream(inputPath, FileMode.Open), System.IO.Compression.CompressionMode.Decompress)) {
using (StreamReader reader = new StreamReader(gzInput, Encoding.UTF8)) {
using (GZipOutputStream gzipWriter = new GZipOutputStream(new FileStream(outputPath, FileMode.Create))) {
string line = null;
while ((line = reader.ReadLine()) != null) {
sbLine.Clear();
sbLine.Append(line.Replace("\t", " "));
sbLine.Append("\r\n");
byte[] bytes = Encoding.UTF8.GetBytes(sbLine.ToString());
gzipWriter.Write(bytes, 0, bytes.Length);
}
}
}
}
}
但出于某种原因,在 while 循环中调用 line = reader.ReadLine() 只会读取一次,然后返回 null(reader EOS = true)。我已经尝试使用 native C# 压缩库和 ICSharpCode 包进行此操作,但我得到了相同的行为。我意识到我总是可以提取整个文件,然后清理它,然后重新压缩它,但我讨厌浪费资源、硬盘空间等。注意:这些是大文件(最多压缩几 GB)所以任何东西使用 MemoryStream 不是一个好的解决方案。有没有人遇到过这样奇怪的事情?谢谢。
最佳答案
经过大量的纠缠,我似乎找到了问题所在。对我来说,某些 GZip 文件可以正常工作而其他文件会显示上述行为这一事实使问题进一步复杂化。例如,如果我自己使用 GZip 创建存档,它会很好用,但从其他来源生成的某些其他存档则不会。
简而言之,.NET GZip 库是垃圾,不要使用它。此外,我使用的 ICSharpCode 库已经有几年的历史了。我不确定它是否曾经搭载底层 .NET 代码,但我之前使用的版本 (0.85.4) 给出了完全相同的行为。当我升级到最新版本 (0.86.0) 时,它按预期工作并且我能够按预期读取完整文件。
希望这对遇到同样问题的其他人有帮助
关于c# - GZipStream with StreamReader.ReadLine 只读取第一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25918793/
文档只是说 ReadBlock 是 “Read 的阻塞版本” 但这意味着什么? 之前有人问过这个问题,嗯? http://www.pcreview.co.uk/forums/thread-138578
我对 StreamReader 类的两个不同构造函数有点困惑,即 1.StreamReader(流) 我知道它需要流字节作为输入,但相应的输出是相同的。 这是我使用 StreamReader(Stre
我试图从一个文本文件中读取,该文本文件在写入时有多个输出,但是当我想从我已经输出内容的文本文件中读取时,我想选择最后一个条目(记住每个条目当写作有 5 行时,我只想要包含“密文:”)的行 但是它正在读
我正在开发一个接受TCP连接并读取数据的应用程序,直到读取标记,然后将该数据写入文件系统。我不想断开连接,我想让客户端发送数据来做到这一点,以便他们可以在一个连接中发送多个文件。 我在外部循环中使用了
我尝试制作一个脚本,该脚本可以逐行读取 TXT 文件,并根据里面的内容更改标签。有没有办法检查正在读取哪一行? 最佳答案 此示例使用 StreamReader 类的 ReadLine 方法将文本文件的
我正在尝试处理文本文件的一部分,并使用 UploadFromStream 将文本文件的其余部分写入云 blob。问题在于 StreamReader 似乎从底层流中获取了太多内容,因此后续写入不会执行任
某处是否有非缓冲流读取器实现? 我通过以下方式创建了我的流 FileInputStream inputStream = new FileInputStream(inputFilename); Coun
我想要一个 string[]分配了一个 StreamReader .喜欢: try{ StreamReader sr = new StreamReader("a.txt"); do{
我想弄清楚如何标记文本文件的 StreamReader。我已经能够将这些行分开,但现在我正试图弄清楚如何通过制表符分隔符来分解这些行。这是我目前所拥有的。 string readContents; u
我正在使用我编写的一些不是最佳的代码...:-| 我有以下代码: string fmtLine = ""; string[] splitedFmtLine;
我正在尝试从我的 Web 应用程序的 App_Data 文件夹加载文件: KezMenu kmenu = new KezMenu("~/App_Data/Menu.xml"); 但出于某种原因,这
我正在尝试使用接收 FileStream 的 StreamReader 读取文件的内容。该文件内部有一些空格(字符 32),StreamReader 将它们读取为 0(字符 48)。屏幕截图显示了 F
我有一些奇怪的问题(对我来说)。 有一个应用程序是 Windows 窗体应用程序“firstapp.exe”。还有另一个应用程序也是 Windows 窗体应用程序“launcher.exe”。并且有一
我需要在 C# 应用程序上同时逐行读取四个非常大 (>2 Gb) 的文件。我使用了四种不同的 StreamReader 对象及其 ReadLine() 方法。 同时从四个文件中读取行时,性能会受到严重
我有一个包装在 System.IO.StreamReader 中的输入流...我希望将流的内容写入文件(即 StreamWriter)。 输入流的长度未知。长度可以是几个字节,也可以是千兆字节。 怎么
我对这篇文章有类似的要求... Populate Gridview at runtime using textfile 我想用 StreamReader 读取文本文件并用文件中的数据填充 DataTa
我应该使用哪种编码来读取 æ、Ø、å、ä、ö、ü 等? 最佳答案 您应该使用原始数据的任何编码。你从哪里获取数据,你有关于它的编码的信息吗?如果您尝试使用错误的编码来读取它,您将得到错误的答案:即使您
你好,我在为 Unity3D 编写编辑器时遇到了问题,我遇到了一个问题,我正在从具有常规字符串的 .txt 文件中读取行,然后在每个常规字符串下方读取文件扩展名(代表扩展名的类别) ).当我尝试在分配
这是我的代码: StreamReader reader = new StreamReader("war.txt"); string input = null; while ((input = read
我正在制作一个函数,它将从 StreamReader 中获取行数,不包括注释(以“//”开头的行)和新行。 这是我的代码: private int GetPatchCount(StreamReader
我是一名优秀的程序员,十分优秀!